- 说明
-
分类:最近更新
-
-
点击数:21600
出国旅游语言不通怎么办?来个XX翻译机让你从此畅通无阻。相信很多人都看过类似的智能翻译机广告,仿佛小时候看哆啦A梦里的翻译蒟蒻道具已成为现实,但在笔者看来,受制于语音识别精度及机器翻译能力的不足,目前这些所谓的智能翻译机全是扯淡。
6年前笔者研究生毕业时,曾邀请母上大人来美国参加毕业典礼顺带玩了一圈,回来之后母上大人就开始时不时看看旅游常用短句之类的书计划未来跟朋友一起来个海外自由行。但无奈岁数大了,记忆力下降严重,这么多年过去母上大人的英文并没有太大长进,所以作为儿子,笔者一直很希望智能翻译技术能有所突破,好帮助母上大人实现环游世界的梦想。
这两年人工智能概念火热,而翻译作为一个重要的刚需自然得到大量公司的青睐,从翻译软件到翻译网站再到翻译手机、翻译机的产品层出不穷,价格从一两百到几千不等。各家都将“人工智能”四个大字当做金字招牌来用于自家产品的宣传,而各路媒体也在旁煽风点火,大有人工智能技术将一统江山,翻译人员全要下岗的态势。
如果对智能翻译技术不太了解的小白很容易就被这样的宣传所蛊惑,但实际上,如果对行业稍微有点了解就能知道这些产品目前还远达不到用户所期待的交流无碍这个标准。
从实现方案来说,分为离线和在线两种。离线顾名思义有点类似小时候用的那种电子词典,缺点是词汇量和参考翻译都有局限性。在线的则是借助云计算和搜索引擎,缺点是没了网基本就快废了。
从功能分工来看,智能翻译分为两方面:一个是语音识别 ,一个是智能翻译。所以对于所有智能翻译机的第一道门槛就是语音识别的精确度,事实就是来说,在这方面,人工智能算法的引入及发展确实让精确度得到了一个质的飞跃。
根据公开资料显示,借助训练过得神经网络系统,谷歌的单次错误识别率开始大幅下降,2013年时还高达23%,而2017年时已降到4.9%,而谷歌的两大对手IBM和微软在2017年的表现分别是5.5%和5.1%,这个成绩同人类相比如何呢?根据报告可知,用英语做日常用语的人类语音识别错误率在5%左右,所以谷歌、微软和IBM的成绩在英语国家已堪比人类。在中文方面,科大讯飞今年公布信息宣布语音识别准确率已达到98%,搜狗和百度则是97%(今年两者信息没有更新)。
从数据来看,语音识别精确度的问题已不严重,但从实际应用来说,依然不尽如人意,一方面是远场语音识别非常容易受到噪音干扰影响准确率(你总不能举着翻译机凑到对方嘴边吧?),另一方面则是一音多字或者多词的问题难以解决。
众所周知,中文的一音多字情况非常普遍,而智能翻译的原理是先将语音识别为正确的文字,然后再从文字转换到希望翻译的语言,当出现一些专有名词或者句子过于简短的时候,中文的识别错误率都会大幅攀升,就比如姓名。别说机器,就算是我们自己如果脱离语境单纯听都能听错,否则相声里的包袱怎么来的?
当然,语音识别精确度并不是最大的拦路虎,真正的挑战还在于智能翻译。每当讨论到这个话题时,笔者的回答永远是:什么时候在线翻译软件能把文档翻译利索了,什么时候智能语音翻译就能实现。如果100%精确度的文档都没翻译对,还谈什么语音翻译?
客观来说,中文由于过于博大精深,因此我们不能苛求翻译机实现100%的准确率,但在笔者看来,在技术不成熟的情况下进行夸张的宣传短期内确实可以促进销量,可从长期来看,这很有可能让消费者未来对此类产品的不信任感不断加深,而这显然不是行业参与者们所愿意看到的。所以笔者还是那句话,适当夸张宣传可以,但别过度忽悠消费者,否则最终砸的还是自己的饭碗。