您的位置: 首页 > 实时讯息 >

西北师大发布DeepJiandu数据集:AI解密简牍 全球与众共享

0次浏览     发布时间:2025-03-28 00:35:00    

来源:中国新闻网

中新网兰州3月28日电 (丁思 刘玉桃)为破解智能化简牍文字识别与内容理解这一重大难题,近日,西北师范大学联合甘肃简牍博物馆推出了DeepJiandu数据集,全球与众共享。

DeepJiandu数据集,是在该校简牍学术资源数据共享平台的基础之上,研究发布的全球首个专门用于复杂场景下简牍字符检测与识别的大规模数据集。该数据集的发布,极大促进人工智能技术对简牍文献信息的理解,为简牍学搭上AI技术快车提供有力支撑。

图为DeepJiandu数据集的字符标注示例,标注框标明了字符的位置和类别。西北师范大学供图

该工作由西北师范大学简牍研究院、甘肃省简牍智能计算与数字人文工程研究中心张强教授团队负责开展,甘肃简牍博物馆、上海中西书局、甘肃文化出版社、西南大学等单位参与了该项工作。

据张强介绍,在纸张普及前的千余年中,简牍是中国古代记录历史信息的重要媒介,承载了战国、秦、汉、魏晋等时期的典籍、律令、契约等,形成了完整的文明记忆链条,简牍是文字传播的核心媒介。

然而,简牍因竹木材质易受腐蚀,尤其在出土后易出现氧化、变色或粘连问题;同时由于简牍材料的脆弱性,长期埋藏环境导致字符模糊、字迹缺损、产生畸变等问题,使得人工识别与整理这些珍贵文献极为困难。现有的数字化技术虽在甲骨文、东巴文、古彝文、古希腊铭文、古埃及象形文字、玛雅文字等相关文献资料等领域取得突破,但在简牍文献资料的智能化处理与分析程度不高,特别缺乏高质量的数据集,制约了人工智能技术在该领域的应用。

图为DeepJiandu数据集图像示例。西北师范大学供图

“DeepJiandu数据集的构建正是为了解决这一问题。”张强介绍说,研究团队通过高光谱成像、图像增强、多光谱融合等技术,确保了高质量的数据构建。数据集涵盖2242种字符类别,并由简牍学专家与计算机专家合作标注,确保数据的专业性与准确性。此外,数据集的设计考虑到简牍中字符的残损、异形字、多种布局等复杂场景,有效提升了模型对历史文献的适应能力。

DeepJiandu数据集的发布,填补了历史文献数字化与人工智能结合的空白,为简牍整理与自动识别提供了重要支持,提升考古学者对简牍文献的解读效率。此外,结合计算机视觉与历史语言学,该数据集还将推动文博机构的数字化转型,为多模态文化遗产保护提供新的技术路径。

张强表示,随着DeepJiandu数据集的推广,研究团队预计将有更多深度学习、计算机视觉领域的研究者加入简牍文献的数字化处理研究,并推动人工智能在历史文献解析、文化遗产保护等多学科交叉领域的应用。未来,团队将继续优化数据集,并探索多模态融合等前沿技术,为数字人文研究提供更强大的技术支持。

目前,DeepJiandu数据集已载入西北师范大学简牍学术资源数据共享平台。该平台已开发了实物库、释文库、字形库、著录库、文献库和专家库六个库,利用人工智能、大数据分析、虚拟现实等先进技术,完成了对4万枚西北汉简的数字化收录,不仅为专家学者提供了便捷的研究工具,也向公众展示了简牍文化的独特魅力。该平台现拥有千余名国内外在线用户,覆盖了国内外384个科研、文化机构和高等院校。(完)

相关文章

下一代iPad mini或搭载三星OLED屏,计划于 2026 年推出

据知名苹果供应链爆料人“数码闲聊站”透露,苹果正评估为下一代iPad mini配备由三星制造的小尺寸OLED显示屏。这一升级或将成为iPad mini系列自2021年换代以来的最大革新,但屏幕刷新率是否突破现有60Hz LCD上限仍是未知数。OLED屏量产时间线成焦点消息指出,三星显示已于2024年
2025-04-05 00:08:00

上海、南京近乎同时召开重磅大会,什么信号?

来源:市场资讯作 者:正风最近几天,长三角的两个重要城市接连召开了两场极为重磅的大会,引起了不小的关注。一是3月25日在上海召开的“2025上海全球投资促进大会”,二是3月26日在南京召开的“2025产业科技创新与投资促进大会”。从命名就能看出,两场会议均涉及了投资促进的议题,具体内容上也都涉及到了
2025-04-04 13:00:00

港股“上新”持续升温!境外投资机构缘何对港股态度积极

一季度,港股新上市公司数量、募集资金规模等指标明显增长,A股优质上市公司选择赴港双重上市意愿增加,港股“上新”持续升温。港交所数据显示,3月最后一周,又有三家公司在港交所上市,涵盖有色金属、消费等行业。这也使得,一季度在港新上市公司总数达到了16家,同比增长33%。从行业分布看,消费、新能源汽车、医
2025-04-04 09:05:00

今日,拥抱AI 点亮江夏,江夏区首届“AI江夏”高校大学生AI应用创意大赛正式启动!

今日,2025年4月1日江夏区首届“AI江夏”高校大学生AI应用创意大赛启动仪式在江夏区区校合作发展促进中心会议室隆重举行。本次赛事旨在以AI技术赋能江夏的历史人文、生态文化、产业特色及乡村振兴,激发高校学子的创新潜能,增强城市吸引力,促进人才“留夏”与产城融合发展。启动仪式上,详细介绍了本次大赛的
2025-04-03 17:25:00

《新华每日电讯》关注青岛:人工智能赋能千行百业

新华每日电讯2025年4月3日5版新华社青岛4月1日电(记者 张武岳)在位于山东青岛崂山区人工智能产业园的自然语义(青岛)科技有限公司,工作人员向记者展示了最新研发的语言类大模型“欧拉”:在一台笔记本电脑上,未接入互联网的状态下,该大模型就可以进行与DeepSeek、ChatGPT等相似的“思考”过
2025-04-03 14:35:00

创新推出“算力券”机制,长沙经开区赋能“人工智能+机器人”产业发展

近日,长沙经开区在全省率先发布了《关于推动“人工智能+机器人”创新发展的若干措施》(以下简称《措施》),从人工智能产业、开源技术、机器人三个领域提出10项具体举措,通过一系列奖补措施,支持这些领域的企业加速技术创新和应用开发。作为国家级经济技术开发区,长沙经开区始终紧跟国家战略步伐,积极响应湖南省关
2025-04-02 22:42:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5