全球最大甲骨文多模态数据集发布

发布时间:2024-07-23 17:01:45 来源:安阳日报

       7月22日,记者从甲骨文信息处理教育部重点实验室获悉,日前在上海举行的世界人工智能大会上,“数字甲骨共创中心”正式发布全球最大的甲骨文多模态数据集,共包含1万片甲骨拓片、摹本,甲骨单字对应位置、对应字头、对应释文以及辞例分组、释读顺序等数据。
        “数字甲骨共创中心”由安阳师范学院甲骨文信息处理教育部实验室、腾讯SSV数字文化实验室、厦门大学、腾讯优图实验室、中国社会科学院甲骨学殷商史研究中心、中国社会科学院考古研究所安阳工作站、郑州大学汉字文明研究中心等单位共同发起,并获得中国社会科学院古代史研究所以及英国剑桥大学等知名高校和研究机构的专业支持,旨在通过汇聚各方的专业科研力量,共同推动甲骨文研究的数字化和智能化。
       此次发布的甲骨文多模态数据集集合了甲骨文数字化研究的最新成果,吸收了当前业界最先进的甲骨文研究资料,运用AI相关技术为数据集的信息丰富提供了支撑。这套数据集的形成,由安阳师范学院甲骨文信息处理教育部重点实验室和腾讯优图实验室、腾讯SSV数字文化实验室、厦门大学联合开发的AI模型技术功不可没。其中的甲骨字检测模型标注准确率超90%,摹本生成模型可以实现摹本—拓片逐像素对齐,字形匹配模型能够自动匹配相近字。基于以上3个模型,实验室与腾讯等单位还开发了最新的“甲骨校重模型”,像“侦探”一样帮助专家找到失传甲骨最清晰的拓片。
       “甲骨文多模态数据集将为人工智能服务甲骨文研究提供数据支持,加速甲骨文研究智能化进程,让更多遥远的声音被今人‘听见’。”甲骨文信息处理教育部重点实验室主任刘永革说。

(声明:本文不代表河南县域经济网观点,如是转载内容,河南县域经济网不对本稿件内容真实性和图文版权负责。如发现政治性、事实性、技术性差错和版权方面的问题及不良信息,请及时与我们联系,并提供稿件的错误信息。)
责任编辑:李丹