网站首页党网·时政经济·科技社会·法治文旅·体育健康·生活观点访谈国际军事港澳台湾视频图片教育

登录人民网通行证立即注册

人民网>>日本频道

理光开发出高性能日语大语言模型

2024年06月05日10:29 来源：新华网

原标题：理光开发出高性能日语大语言模型

　　新华社东京6月4日电（记者钱铮）日本理光公司日前表示，该公司利用和日本理化学研究所共同研发得到的指令数据训练理光的日语大语言模型，提高了模型的指令遵循性能。

　　理光公司3日发布新闻公报说，他们用10329份指令数据对公司研发的130亿参数日语大语言模型进行了指令调优。与调优前相比，大语言模型的指令遵循性能得分从1.19分大幅提高至3.02分。

　　指令调优是训练大语言模型的一个过程，主要为了缩小模型的下一个标记预测目标与用户期望的模型遵循人类指令的目标之间差距。

　　理光公司说，随着老龄化和随之而来的劳动人口减少，许多企业寄希望于利用人工智能来提高生产效率，实现高附加值的劳动方法。而要将人工智能应用于实际业务，需要让大语言模型追加学习包括企业所处行业、所经营业务、以及企业固有用语等在内的大量数据。

　　相比英语国家围绕大语言模型研发的竞争，日语大语言模型的研发相对滞后。这主要是因为日语的语法和表达与英语完全不同，以英语为基础的模型难以充分发挥功能，而研发适合日语的模型首先必须花时间研究日语的特征。

　　大语言模型的研发还需要大量数据，而日语的数据远少于英语，品质和多样性方面也存在问题，日语数据的收集和完善需要大量时间和成本。大语言模型研发还需要很高的算力，而日本超算和云等计算资源原本就不足，能运用这些计算资源的技术和人才也不足。

(责编：许文金、陈建军)

人民日报客户端下载

手机人民网

人民视频客户端下载

人民智云客户端下载

领导留言板客户端下载

精彩图集

今日资讯

精彩推荐

视频新闻

热点排行

人民网版权所有，未经书面授权禁止使用
Copyright © 1997-2024 by www.people.com.cn. all rights reserved