咸阳凯发|百度宣布AI同传最新突破!外媒称媲美人类翻译

2019-12-23 08:26:54 

咸阳凯发|百度宣布AI同传最新突破!外媒称媲美人类翻译

咸阳凯发,百度于硅谷宣布了最新重大突破——一个名为STACL的同传AI,论文结果优异,Demo效果惊人。

同传AI,刚刚在国内掀起过暴风骤雨。

但现在,百度于硅谷宣布了最新重大突破——一个名为STACL的同传AI,论文结果优异,Demo效果惊人。

MIT科技评论、IEEE Spectrum等一众外媒,还纷纷给出好评,这是2016年百度Deep Speech 2发布以来,又一项让技术外媒们如此激动的新进展。

百度自己披露:与现在大多数AI“实时”翻译系统不同,STACL的特点是能预测和延时可控,能够在演讲者讲话后几秒钟开始翻译,并在句子结束后几秒钟内完成。

STACL不走“整句说完再翻译”的路线,甚至还会预测发言者未来几秒的内容,于是延时更短,更接近人类同传。

究竟能达到什么程度?IEEE Spectrum采访后给出类比:跟联合国会议里的人类同传相媲美。

实际效果果真如此?那突破显然重大。

Demo展示:翻译AI会预测△看上去几乎同时了

Demo可以看出,百度STACL的翻译工作延时非常短,与原句只差几个字。

虽说这个AI目前只是同步翻译成文字,还没有合成译文的语音,但这不是重点。关键是,不知道你有没有注意到,这种“只差几个字”有多难得。

还没等“美国总统布什在莫斯科与俄罗斯总统普京在莫斯科会晤。”这句汉语说到莫斯科,自动翻译的英语已经出现了“meet”,也就是汉语句末的“会晤”。

这个“meet”,是AI从前半句话里脑补出来的,依据的是美国总统最可能与其他人发生怎样的活动。

因此,百度这个同传AI,不用等一句话说完,就能开始翻译了。

对于翻译AI来说,预测是一项很罕见的技能。不同语言的语序总有差异,所以,那些没有预测能力的翻译AI,通常需要等到人类讲完一句话,再开始翻译。

再举一个栗子  ,从“百度在18年前”这半句里,AI预测出了百度创立的内容“started a business”。

那么,科学地讲,百度AI的预测效果到底怎么样?

衡量翻译质量,要看BLEU分。

在中译英延后5个字的情况下,比起传统的整句翻译AI,百度的BLEU分要低了3.4分。

毕竟是预测,发生错误是自然的。而这个差距在百度看来是可以接受的。

比如,百度AI可能从前半句话里预测出会面顺利进行,而事实可能是会面并不顺利。翻译就容易出现失误。

面对这样的情况,AI目前并没有纠错的能力。

不过,用小小的延时,就可以换取更高的准确度:如从延3个词到延5个词。用户可以根据需求随意调整。

而当两种语言语序相差不多的时候,例如描述戴安娜王妃车祸事件的新闻,STACL和传统整句翻译的成绩相比,就没有明显差异了。

这种预测能力,是哪来的?

答案是一个名叫wait-k的模型,它把预测和翻译无缝整合到了一起,百度把它和两个翻译模型结合起来做了实验,一个是比较早期的RNN翻译模型,另一个是Google在2017年推出即大热的Transformer。

不过,wait-k不仅仅适用于这两个模型,而是可以用在任何序列映射(sequence-to-sequence)模型上。也就是说,只要有个模型能搞定两种语言之间的翻译,加上这个wait-k做一点小改造,就能实现同传了。

一个机器翻译系统,离不开分析输入语言的编码器和输出目标语言的解码器,而wait-k对机器翻译模型所做的小改动,就在解码器上。它让解码器在输出内容的同时,能预测编码器还没有输入的东西。

百度用这样一个公式描述了这种解码策略:

其中,x代表输入的内容,y代表输出,t代表时间步,而k表示的是解码器比编码器抢跑的词数。

技术细节在论文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency中有详细的介绍。

团队介绍

Mingbo Ma,百度硅谷AI实验室科学家,拥有三个学校的计算机博士学位,今年8月刚从俄勒冈州立大学博士毕业,另外两个学位在美国东北大学和纽约城市大学,本科毕业于吉林大学,此前曾在苹果和IBM实习。

黄亮,俄勒冈州立大学助理教授,百度美研首席科学家,此前曾就职于IBM和谷歌,并在纽约城市大学、南加州大学担任过助理教授,博士毕业于宾夕法尼亚大学。

Hao Xiong,爱丁堡大学计算机硕士,本科毕业于河海大学,2015年加入百度任软件工程师,负责大容量数据处理系统和资源调度系统。

Kaibo Liu,俄勒冈州立大学助理研究员,今年6月刚到百度实习,本科毕业于北大。

Chuanqiang Zhang,低调的百度技术员工,目前无更多资料。

何中军,百度主任架构师,从事机器翻译研究与开发十余年,多篇论文发表在本领域权威国际会议ACL、EMNLP、COLING、AAAI等,参与项目曾获2015年度国家科学技术进步奖二等奖。

Hairong Liu,百度硅谷AI实验室科学家,曾就职于三星和普渡大学,华中科大电子电气博士。

Xing Li,中科院自然语言处理和机器学习硕士,百度硅谷人工智能实验室的高级经理,曾任英特尔技术leader,在百度担任过技术工程经理,领导百度贴吧研发团队。

王海峰,百度高级副总裁,e-Staff,百度AIG负责人、百度研究院院长,哈工大计算机博士。

百度这次技术突破宣布后,首先在外媒引发报道。

有好评。其中评价最高的是IEEE Spectrum,认为百度开发的这个新系统,揭示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一步。

有对比。比如将百度的这次突破与谷歌联系起来。南华早报评论:随着百度新的翻译系统亮相,百度向谷歌发起了挑战。

还有将百度和谷歌放一起当“耦合”的。Engadget观点:

虽然这个系统仍旧有局限性,而且无法在必要的时候取代人类翻译。但是它在谷歌缺席中国的情况下,给出了一种新的选择。

SiliconANGLE则援引分析师评论称:“亚洲的语言翻译方面仍然存在一定的局限性,看到本地的玩家加入到这个游戏中来,的确是一件好事。”

但目前最多的态度是观望。

在技术宅密度比较高的Hacker News和Reddit上,百度的这条消息,并没有引发太多的讨论。

截至早上7点40分,Reddit只有一条评论,Hacker News上有两条评论——虽然这个消息发布已有5个多小时。

Reddit上面的一条评论有点“水”,只是说这个Demo很好。

Hacker News的两条评论中,一条比较有技术含量,提出了如何翻译德语的问题,并给出了一些示例,另一条是说,这个Demo很好。

不过这个技术到底好不好,更多中外关注者马上都能给出判断。

因为百度最快会在下周的年度技术大会上,进行公开展示。

究竟是重大突破,抑或还只是完美Demo,到时一看便知。

当然,有科研实力有技术复现的同学,现在就能去试试了。

欢迎反馈你的测后评价~

随机推荐
  • 2018年我国器官捐献位居世界第二 移植质量不断提升

    2018年,我国完成器官捐献6302例,位居世界第二位器官移植,让生命在阳光下延续沈冰清制图“我是叶沙的肾。”一个名叫叶沙的16岁男孩,因脑溢血去世后将器官捐献。器官捐献数量快速增长,移植质量不断提升自2015年1月1日至2018年12月31日,中国公民逝世后器官捐献累计完成18294例。其中,2018年完成器官捐献6302例,位居世界第二位。器官捐献移植领域的发展任重道远虽然中国人体器官捐献与移 [详细]

    2020-01-01 16:48:59
  • 争气!古丽中学两名学子昨出征清华园

    古丽中学昨捷报飞传,该校勇夺全国高中数学联赛一等奖的胡力尹(高二)、黄俊豪(高一)两名学子,通过清华大学2019年“全国优秀中学生数学体验营”资格审查,并于昨日启程赴清华大学参加体验营。此次清华行,胡力尹和黄俊豪还将与古丽中学优秀毕业生、已在清华硕博连读的学姐胡晓瑜见面。胡晓瑜当年是古丽中学首批少年竞赛班学生,高二被武汉大学录取,大三时考取了清华大学直博生。 [详细]

    2020-01-09 08:40:36
  • 李映辰:欧系货币延续盘整 澳元挑战中线支撑

    日线图,均线系统的压制位被刺破,大级别前方低点1.1300的支撑被继续冲击。英镑持续对此前的反弹走势进行横向整理。4小时图,K线连续收阴,0.7200被跌破之后,目前即将挑战0.7020的大级别低点支撑。综合来看,短线澳元和美日的走势相对较为良好,今天可重点关注。 [详细]

    2019-12-25 13:14:04
  • 神叨酱:1.26日心灵运势占卜

    本篇运势针对大家每日心灵成长的指引和生活的方向,拥有四个选项,每天根据自己的第一感觉,从1234选项中选取一个,找到今日神谕卡的指引。—————— 占卜规则:保持内心安静的状态,在心中默念1.26日,天使卡给我的指引是什么?——————-解析: 选择1:温柔 分析:缓和下来你的心灵,你可以用温柔缓慢的方式来面对你的生活。———————— 每日的指引,既能帮助你在今天找到方向,也能给你一些警示或者提 [详细]

    2019-12-24 19:40:57
  • 手掌般大小,男孩子的最爱,承载着百年汽车历史的模型文化

    但这掩盖不了汽车模型是百年汽车历史的见证者的事实。后来,得益于福特简单的营销手段,汽车模型真正的被推广开来。作为汽车历史中采用流水线装配作业的始作俑者,福特同样是模型界首个量产出汽车模型的厂家。后来,福特的这一做法被各大厂商纷纷效仿,雪铁龙为了提高仿真程度,甚至直接将汽车的设计图纸提供给了模型生产厂家。 [详细]

    2020-01-09 11:21:00
  • 多家上市公司披露送转预案 不再以送转数量取胜

    多家上市公司披露送转预案 不再以送转数量取胜 分析人士称——新规下高送转股基本面有望改善广州日报讯上市公司2018年年报披露大幕已正式拉开,与此同时,上市公司送转预案的披露也逐渐进入高峰。1月以来已有10余家公司公布送转预案。送转数量不再以多取胜1月21日晚间,兴瑞科技、三祥新材、西泵股份三家公司披露了2018年度利润分配预案。2018年11月23日,沪深交易所双双发布高送转指引新规。 [详细]

    2020-01-01 17:04:47
  • 封面传媒与华为达成战略合作:共建融媒体中心、视频版权交易平台

    双方代表现场签署了战略合作协议。为此,封面传媒与华为将结合区域性不同特征和需要,进行持续性的深度合作,通过整合信息服务资源、信息数据共享、智媒体技术应用以及可视化平台终端等融合共通,实现移动互联的“内容+服务”模式,共建融媒体中心。 [详细]

    2020-01-04 15:17:36
  • 罗永浩发布 Sharklet 鲨纹材料:物理抗菌防污

    12 月 3 日,“老人与海”发布会上,罗永浩宣布加盟 sharklet 公司,成了其“全球合伙人 & 首席忽悠官”,并发布了 sharklet 公司的鲨纹材料。sharklet 能够抑菌的第一个原因:接触面积小,所以不易附着。此外,现场还发布了运用 sharklet 抗菌材料的地平线 8 号抗菌儿童背包,原价 499 元,预售价 399 元;以及同样运用了 sharklet 抗菌材料的地平线 8 [详细]

    2020-01-11 19:06:26
  • 中信建投黄文涛:数据整体低于预期 经济处关键阶段

    中信建投黄文涛:数据整体低于预期,经济处于关键阶段国家统计局今日发布今年前三季度国民经济运行情况,GDP同比增长6.5%,低于前值的6.7%。中信建投证券宏观固收首席经济学家黄文涛点评如下:一、经济增长与工业生产回落超预期。餐饮收入增速回落,与节假期间旅游数据偏弱一致。六、整体来看,三季度与9月经济数据低于预期,目前可能重新进入政策调整期。 [详细]

    2020-01-06 19:52:53
  • 枣庄6旬老人收藏万块奇石,建博物馆免费开放

    作为枣庄首家民办的观赏石博物馆,它的免费开放也迎来了不少慕名而来的各方朋友。馆长庄福东多年来唯一的业余爱好就是收藏奇石和根艺,也是目前枣庄市内收藏规模最大的藏家,被圈内人喻为 “石痴”。据庄福东介绍,他从1999年开始收藏奇石,至今已快20年,共收藏了1万多块石头,也花费了他所有积蓄,由于和奇石感情深厚,也为了让更多人都能欣赏到这些宝贝,2002年的免费观赏石博物馆也应运而生。 [详细]

    2020-01-05 13:42:38