第01版:头版 下一版  
上一篇 下一篇

东巴古籍智能翻译系统面世

深度保护传承世界仅存象形文字

本报讯(记者 李兴文 李铁成 和茜) 近日,由华东师范大学与丽江师范学院组成的社会实践团队联合丽江市东巴文化研究院,依托语言文字基础理论与多种人工智能技术,成功研发并发布东巴古籍智能翻译系统。

东巴文是纳西族的独特文字,拥有1400多个单字,是目前世界上唯一存活的象形文字,被誉为文字的“活化石”。丽江市东巴文化研究院编著的《纳西东巴古籍译注全集》于2003年被联合国教科文组织列入《世界记忆名录》。然而,由于其字符的多样性和非标准化特征,传承复杂且充满挑战。

基于此,2021年底,华东师范大学、丽江师范学院和丽江市东巴文化研究院组建跨领域专家团队,启动东巴古籍智能翻译系统研发项目。系统以实际翻译流程建模,构建“图像—语音—直译—意译”级联式智能翻译流程。在人工采集与专家协作基础上,建立包含257760个手写东巴文的数据库,集成563580组“形、音、义”多模态数据集。通过深度学习技术,实现对东巴古籍中象形文字的智能化识别与分割处理,并以华东师范大学智能教育研究院自主研发的教育大模型EduChat为基座,经过大量语料数据训练,实现东巴文智能翻译的领域适应。

经过近3年的努力,该系统初步实现东巴古籍的智能识别与翻译功能,不仅可以实时反馈提供修改建议,优化翻译流程,还支持用户对翻译结果进行个性化调整,以满足专业研究的需求。

丽江市东巴文化研究院院长和洁蕾表示,该系统的研发是数智时代背景下人工智能与多学科交叉融合的探索,将推动东巴古籍文献的深度保护、研究和利用。

据悉,三方还将深入探索东巴文的语义和文化细节,扩展多模态语料库,持续优化和迭代东巴古籍智能翻译系统。

  • “天空之眼”受欢迎

  • 交通“流量”彰显经济活力

  • 我省持续发力建设美丽河湖

  • 报头

  • 认真学习贯彻习近平总书记重要讲话重要指示精神

  • 东巴古籍智能翻译系统面世

  • 为您导读

  • 加速人才与产业良性互动深度融合

  • 让群众在“家门口”能看病看好病

  • 报脚

  • 滇ICP备08000875号 互联网新闻信息服务许可证编号:53120170002 信息网络传播视听节目许可证号:2511600
    互联网出版许可证:新出网证(滇)字 04号
    广播电视节目制作经营许可证号:(云)字第00093号
    电信增值业务经营许可证编号:滇B2-20090008 ® yunnan.cn All Rights Reserved since 2003.08
    未经云南网书面特别授权,请勿转载或建立镜像,违者依法必究