日前,记者从自治区数据局获悉,老挝国家大模型已完成训练并部署上线,经权威机构开展模型能力测评显示,该模型在中、老、英三语翻译及互译能力各领域场景表现优秀,尤其是在老挝语理解和内容生成、文化相关、本地适应性等方面表现优越。
作为广西开展面向东盟人工智能合作的重点项目,老挝国家大模型是东盟国家首个非通用语种国家大模型。这是广西人工智能产业纵深发展的重要机遇,但同时也面临着以往模型研发从未遇到的困难。
针对老挝语电子语料匮乏,数字基础设施和数字经济基础较弱,双边语言表达、风俗习惯差异大等核心瓶颈问题,自治区数据局联合国内顶尖研究机构和企业全力推进研发工作,同时综合考虑研发成本、老挝方面需求、未来模型升级空间和成本等因素,开展模型架构设计,探索出针对非通用语种的低成本、可复制的基础模型技术框架,并应用于越南、泰国、马来西亚等多个东盟国家基础模型研发当中。
老挝国家大模型训练的成功完成,不仅令广西探索出可复制的东盟低资源非通用语种国家大模型研发方法和路径,同时培养了覆盖数据采集加工、模型训练微调等多个领域近百人的人才队伍,成为全区人工智能产业和人工智能应用发展的有力支撑。
下一步,广西将以老挝国家大模型为基础,体系化、全方位推进中国—东盟人工智能合作,围绕农业、医疗、旅游、教育、金融、物流等重点领域人工智能垂直应用场景,推进行业大模型建设。
报纸版面截图。
来源|广西云-广西日报