国际最新研究称,一人工智能模型能翻译200种不同语言
中新网北京6月8日电 (记者 孙自法)国际著名学术期刊《自然》最新一篇人工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。
该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都公开、低成本或是普遍可及,此类语言被称为“低资源语言”。而增加模型在翻译语言数量上的语言输出可能会影响模型的翻译质量。
为此,本篇论文作者、“不落下任何语言”(No Language Left Behind,NLLB)团队开发出一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力来翻译低资源语言。作为成果,NLLB团队开发了一个在线多语言翻译工具,名为NLLB-200,该工具能容纳200种语言,其低资源语言数量是高资源语言的三倍,翻译表现比已有系统高了44%。
由于NLLB团队在许多低资源语言上只能获取1000-2000例样本,为扩大NLLB-200的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。该团队还从互联网存档中挖掘双语文本数据,帮助提升了NLLB-200的翻译质量。
《自然》同期发表同行专家“新闻与观点”文章指出,NLLB团队研发的这个工具,可以帮助很少被翻译的那些语言的使用者,让他们能使用互联网和其他技术。
此外,NLLB团队还强调教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。不过,该团队也提醒说,误译的情况仍有可能出现。(完)
相关推荐
黑龙江饶河再现野生东北虎足迹
四川内江市市中区发生3.2级地震 震源深度10千米
海南将迎来春节前出岛车客高峰 各港口出岛秩序总体平稳
(新春走基层)“喜迎全运会 瑞蛇贺新春”新春庙会在广州举行
羊角把、牛角、十字扣,春运涨知识→小设计大用途
岁暮冰嬉 寒尽春生 这些“速度与激情”谁看了不想玩一把?
“家门口能挣钱,好日子有盼头”(新春走基层)
国家中医药局:九成以上三级妇幼保健院设置中医类临床科室
湖南零陵腊肉飘香年味浓 供销两旺助增收
春节临近 你的家乡举办哪些活动?一起来寻找年味儿→
新春走基层丨让每一盏车灯都安然明亮 他们是“魔鬼风口”的风雪护路人
中国将386.7万家固定污染源纳入排污许可管理
- 最近发表
-
- 随机阅读
-
- 国家发改委与塞尔维亚有关部门达成三份合作文件
- 进入夏季,大熊猫为何“扎堆”过生日?
- 第八届花城文学奖获奖名单揭晓
- 整改就整改,菜市场何须拿大气防治当借口
- “非遗广西”丛书新书发布 全方位展示广西非物质文化遗产
- 专家:中药结合中医推拿可缩短儿童支原体肺炎感染病程
- 元宇宙赋能“国潮热”,“头号玩家”不远了
- 江西“样式雷”太和殿木结构模型入藏中国国家版本馆
- 浙江永昌堡和《王氏族约》:一地标 一坐标 一传承
- 战“疫”科普:保护自“脊”
- 今年去这些人少的小公园品品京城银杏
- 湖南黔阳古城千人共尝长龙宴 喜迎龙年
- 四川森林消防紧贴实战开展综合比武
- 甘肃临夏州积石山县震区电力逐步恢复
- 文化中国行丨600多岁“高龄”风姿不减 被这样的嘉峪关长城惊艳到了
- 远销80多个国家和地区,这座小城“萌”遍全世界!
- 中国证监会规范上市券商市场化融资行为
- 贵州脱硫石膏铁海联运专列首发 “试水”东南亚建材市场
- 辽宁:进一步加大对实体经济资金投放力度
- “大地欢歌”云南乡村文化活动年正式启动
- 热门推荐
-
- 数据机构:中小企业是AI应用生态繁荣的关键
- “大牌感”十足的银行制服咋来的
- 《再见老张》的背后 小剧场走出“某某某”
- 沉睡3000多年,小古城遗址还有哪些未解之谜?
- 中新真探:银杏果能降脂降压吗?
- 网络安全保险如何规范健康发展?两部门提出5方面10条意见
- 新疆遭遇强寒潮天气 交通受严重影响
- 广东出台发展壮大农村经营主体“31条”措施
- 塞浦路斯扩建难民营以接纳激增的中东难民
- 截至2021年底,中国现行文化和旅游国家标准、行业标准累计232项
- 王毅会见印尼外长蕾特诺
- 北京亮马河开启2024醒春首航 亮马河文化经济带将再升级
- 花费上万元没治好1.88元的老药却管用
- 佐科谢幕:自梭罗来,到梭罗去
- 广东阳江青洲一、二海上风电场项目风电机组安装完成
- 樱花季悄然开启 这些赏樱地等你打卡
- 林散之与二十世纪书法史
- 北京亦庄出专项政策扶持外企 最高奖励1亿元
- 美媒预测:特朗普率先获得过百张选举人票,哈里斯获得99张
- 业界专家学者齐聚重庆 共话视听传播未来发展