近日,我院牵头申报的“语言资源的数据规范与共享机制研究”项目获国家语委“十四五”科研规划2022年度省部级重点项目立项。该项目周期为2年,由我院基础标准化研究所承担。
基础标准化研究所承担了全国语言与术语技术委员会(SAC/TC 62)秘书处,主要负责语言、术语、语言资源管理、翻译技术及语言服务等专业领域内的标准化工作,在语言资源技术研发、应用服务、标准化建设等方面,具有扎实的工作基础和实践经验。
当前语言资源建设和服务已形成了规模巨大的产业,但由于语言资源存在数据量大、类型多样、高度分散等特点,且缺乏统一标准和规范的指导、缺少安全可信的协作机制,致使各语言资源处于相互封闭的孤岛状态,大量语言资源难以合理、有效地整合和应用。语言资源相关标准的缺失也使得我国语言资源建设长期受制于海外标准,影响我国在语言资源领域的国际话语权。本项目将研究分析语言资源共享中的关键要素,构建语言资源数据规范标准体系框架,设计评价反馈等语言资源共享机制,并研究共享应用技术,从而提升语言资源共享有效性、安全性,充分发挥语言资源的经济价值和社会价值。