加入收藏 | 联系我们

返回上一页详细内容

科大讯飞AI同传“造假”始末,“误解”是谁造成的?

2018-09-26 09:23:17 作者: 来源:投资潮 浏览次数:0 网友评论 0

中华PE:

\

9月20日,同传译员Bell Wang在知乎发布题为《科大讯飞,你的AI同传操作能更风(qi)骚(zha)一点吗》的文章,质疑科大讯飞宣称的AI其实是虚假包装和营销。Bell Wang指出,他与搭档在为2018创新与新兴产业发展国际会议(IEID)的高端装备技术与产业分会场提供同传的过程中,科大讯飞在知领直播时宣传的所谓“智能翻译”其实就是语音识别,将同传译员翻译的内容转录为文本,再用机器读出,并且这一系列操作完全没有告知同传译员。文中还提供了图片和视频内容作为证据。

文章一出,评论有不少翻译、速记行业的工作者也描述自己的经历,指出科大讯飞的机器翻译准确度并不理想。

对此,科大讯飞在9月21日发布《关于所谓的“同传造假”,我们有话要说》,对此事件进行了回应,表示“因某会议现场机器转写问题,致同声传译老师对科大讯飞产生误解。”

根据科大讯飞的说明,其智能会议系统可以提供语音转写成文字并在屏幕上同步显示的功能,也可以提供翻译服务。其中,翻译服务有两种方案,一种是全自动翻译,由机器翻译并同步展示在屏幕上,没有任何人工参与,这种服务屏幕上显示的logo是“讯飞听见-AI离线翻译系统”;另一种是人机耦合,就是由同传译员来翻译,机器提供语音转写和翻译结果给同传参考,辅助同传降低工作强度,这种服务屏幕上显示的logo是“讯飞听见”。

Bell Wang在文章中指出的问题,其实只涉及到第二种方案,“讯飞听见”,也就是人机耦合的服务。科大讯飞在前一日开幕大会上进行了说明,但是由于译员没有接收到相关通知,因此是沟通不畅导致译员方面产生了误解。

今日,Bell Wang再次发布《今天讯飞给我打了个电话》,公开了科大讯飞消费者事业群副总裁,听见科技总经理王玮与其进行语音沟通的内容。双方最终结论落于两个关键点。第一,以后在牵涉到科大讯飞提供技术的会议中,应当与译员沟通,得到知情同意并签订协议,说明其技术及用途,并保障译员翻译内容未征得同意不得使用;第二,科大讯飞在营销和公关方面需要加强,不放任媒体过分宣传,避免外界产生错误认知,其产品和技术被过分抬高。

一个是保障译员的知识产权,一个是不让媒体过分夸大AI。至此科大讯飞涉嫌造假事件以“误解”结束。但是就双方沟通来看,还有一些问题没能彻底说明。

第一,智能翻译。

同传译员最初的愤怒来自于译员的权益被侵犯,对于“讯飞听见”,译员本就有着非常正确的认知,Bell Wang在文中这样描述讯飞听见——“识别同传的翻译打在屏幕上方便听众,并无意冒充AI同传”。但是激怒译员的不是自己的翻译内容被讯飞听见转录成文字,而是后面的环节——再将文本内容转为机器人语音传达给听众。在第一篇文章中,Bell Wang提供的截图显示,科大讯飞在知领的同传直播页面上用了这样的描述:

image.png

那么何为“智能翻译和自动语音播报”?按照本次直播的工作过程,“智能翻译和自动语音播报”就是同传译员的人工翻译经由科大讯飞变成机器声音过程。既然之前说明了是“讯飞听见”,而不是“讯飞听见-AI离线翻译系统”,只是转录而不是翻译,那么用“智能翻译”这样的描述显然与其提供的实际服务不符。

科大讯飞在语音技术领域深耕多年,技术涵盖盖语音识别、语义理解、语音合成、机器翻译等各个语音领域,语音技术上有着很强的优势。2011年,科大讯飞率先在国内将神经网络技术应用到机器翻译,2011年~2013年推出新一代的语音识别、语音合成、机器翻译语言模型。

其机器翻译技术在2016年就落地了,当时推出晓译翻译机,引领了国内翻译硬件市场。官方数据显示,过去一年讯飞翻译机销量达到20万台,覆盖了137个国家,服务次数超过2000万次,用户好评率达到98%。今年4月份推出翻译机2.0,到8月14日,科大讯飞高级副总裁、董秘江涛在2018年半年度业绩交流会上表示,翻译机2.0上市两月销售了近10万台,用户覆盖了145个国家。

此次争论的焦点并不在于AI是否能抢了同传的饭碗,也并不在于科大讯飞的技术是不是靠谱,而在于公司是否在商业宣传方面有失稳妥。

第二,TTS。

在Bell Wang与科大讯飞沟通的过程中,有这样的内容——“讯飞还是提供了TTS的技术支持,目的是为以后可以实现的多语言平台进行演练(这里王女士解释了,比如一共有五种语言的与会者,可能一个小语种找不到翻译,那么可以借由其他译员翻译出来的文本作为中心语言,然后文本翻译到该小语种,再人工语音输出)。”TTS即文本到语音,还是把文本读出来。如果是为多语言平台进行训练,那么对于小语种的转化难度仍然集中在翻译环节,而不是将人工翻译好的文本转录为语音输出的环节。TTS在演练机器对小语种的翻译能力方面,似乎没有太大帮助。未经译员同意,将文本用机器读出来,目的是服务于多语言平台演练的说法立不稳。

整个事件最终问题简化为双方沟通没有做足导致了误解。本质上是知识产权的纠纷,而不是翻译工作会不会被人工智能取代。但是我们根据以上两点可以发现,从科大讯飞的宣传到回应,确实有打擦边球之嫌。

如果讯飞听见只是提供一次转写服务,即译员的语音到文本,那么人们理所当然可以看到讯飞听见在运行。但是第二次转写,文本到机器朗读,可以说是没有必要的。经过两次转写就非常容易误导听众,直接听到从发言者的语音到机器朗读的语音,忽略中间的环节。这一环节恰恰是最重要的翻译劳动,将这一环节隐藏,科大讯飞的“AI同传”也就顺理成章。因此,不仅仅是译员容易将“讯飞听见”的转写功能误会成“机器同传”,普通用户不会去深究翻译过程,因此更容易理所当然地将这段翻译归功于科大讯飞。这个操作本质没有“造假”,没有宣称自是AI,但是已经达到了“造假”的效果。

科大讯飞在2010年之后专利数量逐年迅速增长,2013年出现井喷,一年的专利申请量达到131件,之后数量逐年回落。去年年底的一项报告显示,对科大讯飞所申请专利的IPC分类进行分析,语音分析或合成、语音识别、音频分析或处理是其最为核心的专利技术,占到发明专利总量的43.97%, 腾讯、百度、中兴等企业在技术研发与专利申请中参考了科大讯飞的技术专利。

科大讯飞在语音合成领域已经相对成熟,深度神经网络语音识别研究是从2010年开始的,虽然落后于微软,但是也早早地将深度学习全面用于讯飞语音处理,并且取得了不错的成绩。人工智能的路还有很远,语言不是一门机械化的学问,即使是备受用户好评的翻译机,也经常会在实际应用时闹出各种各样的笑话。英汉互译尚且如此,更遑论小语种、方言等更大的范围,以及口音、语速、语气、说话习惯等随时会出现的不确定性。需要更多的数据和模型进行大量训练,才能得出更加准确的结果。未来科大讯飞仍然会通过人机耦合来服务同传行业。

目前讯飞的机器翻译更多的服务于日常,在专业的术语面前还有很大的缺失,但科大讯飞目前在国内智能语音领域可以说是积累最为深厚的企业,未来仍然可期。但是,不论是自身宣传还是外界对科大讯飞的认识,都应当报以一个诚实和客观的态度,真正立足于产品和服务,而不是为了宣传,在不必要的环节不知所谓地“赋能”。

 

分享到: 更多

相关文章

[错误报告] [推荐] [收藏] [打印] [返回顶部]

  • 验证码: