来自 科技 2021-08-12 09:28 的文章

字节跳动获得计算语言学顶级会议ACL最高奖项

  北京时间8月5日,国际顶级学术集会会议ACL 2021正式揭晓“最佳论文”奖项,字节跳动AI Lab的呆板翻译技能论文在3350篇论文投稿中脱颖而出,当选本年度“最佳论文”。这是ACL创立59年以来,华人科学家团队第二次赢得最高奖项,此前由中科院计较所主导的研究项目曾被评为ACL 2019“最佳长论文”。  

  ACL大会由国际计较语言学协会主办,是自然语言处理惩罚与计较语言学规模第一流此外学术集会会议。自然语言处理惩罚被誉为“人工智能皇冠上的明珠”,在呆板翻译、搜索、信息流、输入法等规模有着遍及的应用。

  连年来ACL大会吸收的投稿量一连上升,华人团队在该规模研究取得了环球瞩目标后果,已往数年间曾得到“最佳长论文”、“最佳学生论文”和“精巧论文”奖项。本年除了字节跳动赢得最高荣誉,大会还评出了六篇“精巧论文”,香港中文大学与腾讯AI Lab的相助论文乐成入选。

  字节跳动的获奖论文提出一种新的词表进修方案VOLT。词表是所有自然语言处理惩罚任务城市利用的基本组件,其浸染就像人类查字典的索引。研究人员创新地把经济学和数学的常识运用到词表中:首先用“边际收益”界说了词表质量的评价指标,然后以“最优运输”的数学要领办理最优词表的生成问题,从而在多种翻译任务上取得精彩的结果。VOLT研究项目现已向全球开拓者开源。

  ACL官方评审认为,“字节跳动的VOLT方案对呆板翻译中一个重要问题提出了有效且新颖的办理方案,能显著淘汰词表的进修和搜索时间,相信其不只会在研究界发生重要影响,在家产应用方面也有着庞大潜力”。

  据悉,最佳论文研究成就将在字节跳动的火山翻译业务中慢慢落地,为飞书、今天头条等产物和火山引擎的企业级客户提供呆板翻译支持。2021年以来,火山翻译实现多项重要技能打破,研发出支持150个语种互译的大局限翻译模子mRASP2,并对外开源了当前业界最快的推理和练习引擎LightSeq2.0,以及端到端语音翻译东西包NeurST,得到开源社区的遍及好评。

  在此前由ACL举行的呆板翻译大赛WMT2021上,火山翻译以独创的“并行翻译”系统参赛,夺得德语到英语偏向角逐自动评估第一名。“并行翻译”在国际赛事中首次表态,就击败了从左向右逐词翻译的传统技能,冲破后者在呆板翻译规模的绝对统治职位,这项技能的论文也获得ACL 2021大会收录。(李记)

【编辑:黄钰涵】