来自科技 2021-05-11 09:33 的文章

循环智能与华为云联合推出首个千亿中文语言模型

　　4月25日,轮回智能(Recurrent AI)与华为云连系推出千亿参数、40TB练习数据的全球大中文语言预练习模子“盘古”,鹏城尝试室提供算力支持。在权威的中文语言领略评测基准CLUE榜单中,总后果及阅读领略、分类任务单项均排名第一,刷新三项榜单记载,总后果得分83;在NLPCC2018文本摘要任务中,取得了Rouge平均分0.53的业界好后果,逾越第二名百分之六十。

　　“跟以往的大局限预练习模子差异,盘古模子从第一天起就是奔着贸易化落地和企业级应用的角度举办设计和研发的。”轮回智能(Recurrent AI)连系首创人杨植麟博士暗示,“作为一个深耕 NLP 企业处事的团队,我们看到了 GPT-3 等大局限预练习模子的潜力,但也看到了它们在落地进程中的范围。盘古NLP大模子正是为了降服这些范围而生。”

　　三大创新,对准NLP大模子落地困难

　　在NLP大模子的企业级落地应用中,GPT-3等模子由于应对巨大商用场景的小样本进修本领弱、难以团结微调扩展业务场景以及难以融入差异规模的常识,所以很难在贸易场景中获得应用。为了降服这些范围,盘古NLP大模子带来三大创新。

　　第一,盘古NLP大模子在小样本进修任务上逾越GPT-3,办理后者难应对少样本巨大商用场景的问题。好比在企业客户心声阐明和员工执行力阐明场景中,利用盘古NLP大模子出产语义标签时,实测获得方针功效所需的样本量仅为GPT-3模子的十分之一,即AI出产效率可晋升十倍。

　　第二,盘古团队在预练习阶段插手了基于 prompt 的任务,大幅低落微调难度,办理以往大模子难为差异行业场景举办微调的问题。在下游数据富裕时,微调难度的低落使得模子可以跟着数据变多而一连优化;在下游数据稀缺时,微调难度的低落使得模子的少样本进修结果获得显著晋升。好比,在企业借助相同内容判定客户购置意向,以找出更多方针客户从而晋升转化率的场景中,实测盘古NLP大模子对比GPT-3可晋升 27% 的成单转化率。

　　第三,除了能像GPT-3等仅基于端到端生成的方法以外,盘古NLP大模子还可以通过少样本进修对意图举办识别,转化为常识库和数据库查询,办理以往大模子难融入行业常识和数据的问题。好比在金融处事场景中,盘古NLP大模子能更好地赋能及时相同帮助系统,辅佐处事人员快速晋升业务程度,重塑消费者体验。

　　另外,盘古NLP大模子涉及千亿参数、40TB练习数据,对算法、算力、海量数据处理惩罚都提出了很大挑战。在算法方面,轮回智能与华为云的算法研究团队颠末数月的连系攻关,通过在预练习阶段引入基于Prompt的任务等多项创新方案,乐成打破了大模子微调的困难。在算力方面,鹏城尝试室的海内大局限AI练习集群鹏城云脑II,在大模子练习中展示出强大的AI算力和数据吞吐本领,为盘古大模子练习打下坚硬的基本。在海量数据处理惩罚等方面,华为云底层软件、练习框架、ModelArts平台协同优化,充实释放算力,达玉成栈机能优化。

　　全新理念,加强“人”的智能

　　在高附加值的产物销售与处事进程中,如保险、房产、教诲、财产打点等行业,企业需要借助人与人之间的相同进程,让销售人员与客户成立更细密的联络,提供更专业的处事。但由于销售人员的素质和本领晋升迟钝,同时企业缺乏对方针客户的相识,导致客户体验不佳,销售难获增长。

　　轮回智能(Recurrent AI)为企业提供人员产能晋升、精准销售和新一代合规质检办理方案,辅佐企业更快地晋升销售人员本领、更快地找到方针客户以及低落合规风险。

　　• 人员产能晋升 Expert↑:借助深入业务流程的优秀实践挖掘、相同及时帮助和执行监视报表产物组合,辅佐企业将优秀销售人员的实践履历通报给每一名普通销售。在与客户相同中及时帮助销售人员,晋升他们的表示,将他们为企业缔造的代价最大化。

　　• 精准销售 Target↑:轮回智能开创了基于相同对话数据与成单功效的意向预测模子,通过算法模子,可筛选存量线索中的高意向线索,或筛选对某产物更感乐趣的客户名单,辅佐销售人员更精准地找到方针客户,晋升销售和处事效率。

看过的人还看过…