未来,机器是否会取代人工翻译?

18.12.2014  21:45

科技博客用翻译软件来翻译硅谷资讯,大学生使用翻译软件阅读英语论文,海外旅行者已把翻译App作为手机必备应用,看样子机器翻译就要取代译员,如同机器在问答、导航、收银这些岗位做到的一样。那么现在机器翻译究竟做到什么程度了?

机器翻译初具“理解”能力

理想丰满,现实亦可期。尽管现在机器翻译距离人工翻译还有一段距离,但随着技术的发展和人类对语言认知的深入,机器翻译取代人工翻译很值得期待。

单词翻译是最为简单的,就是词典在做的事情,单词与单词放在一起,成了短语也可以应付。短语和单词构成句子,不同场景下有着不同的意思,如果还要考虑这些句子在不同篇章中,基于上下文语境的意思,这对机器翻译而言就有点儿难度了。

举个通俗的例子,电影字幕的翻译大家都很熟悉,也都知道只有翻译者理解了导演要说什么,演员要讲什么,理解了故事的来龙去脉,具备对应的专业背景知识,才能带给观众好字幕。

工业界的翻译技术与它有异曲同工之处,目前尚处于能够准确翻译短语和单词,同时不断提升句子翻译质量的阶段,且逐步向精准的篇章翻译靠齐。

句子翻译两大难题:消歧和调序

机器翻译尚处于“句子翻译“的初级阶段,即准确地理解每一个句子的基本意思。据百度NLP(自然语言处理技术)技术人员介绍,尽管机器翻译在句法理解上有所突破,但最大的难点还在于消歧和调序。

一个是顺序问题。长句子,英文的语序和中文的是不一样的,比如中文“在这张桌子上有一束花”,英文是“There are a bunch of flowers on the table”。这样的不同是当前机器翻译的一大难点,机器翻译需要做到适当地调整顺序。

第二个问题是歧义问题。一个词有多个语义,比如“看”这个词,看病、看书、看球,是不一样的;打球、打赏、打牌、打脸中“打”的意思也非常不同。如果直接将句子中的“看”简单翻译为Look自然不行,而这样的情况又无法穷举。

消歧和调序是机器翻译要解决的最重要的两个问题。如果能够突破,机器翻译未来就可以帮助人们做更多事情。

机器翻译突破的杀手锏——NLP技术

业界如何解决机器翻译所面临的问题呢?不妨看看百度翻译的思路。

百度翻译的核心方案是依靠NLP技术。NLP技术能够基于海量自然语言语料库,通过机器学习自动理解不同单词、短语和句式,模拟人脑思考过程去理解自然语言。

比如,为了增加更多语种之间的互译可能,百度翻译选择中文或英文作为中间语言,在其他语种之间架起一座‘翻译桥梁’。由于不同语种间的语料规模不一,并且一些小语种间的直接翻译模型也较小,如果用户想要将葡萄牙语翻译成日语,通过这项中轴语技术,机器将自动从葡语——中文——日语,葡语——英文——日语等模型中识别并过滤出最优模型,进而迅速呈现最优翻译结果。

凭借NLP技术的深厚积累和领先优势,百度翻译在很多方面超越同类竞品。大规模语料去噪和过滤技术、基于枢轴方法的翻译知识桥接技术,使得资源匮乏的小语种翻译成为可能。此外,凭借着在中文资源上的先天优势,百度翻译还实现了普通话和粤语、文言文之间的互译。

机器面对情绪丰富的人类,会醉吗?

什么才是好的翻译?清末著名学者严复曾提出三个字“信、达、雅”。信是指要准确;达是指说人话接地气;雅则是指译文要词语得体、简明、优雅。最生动的例子莫过于“Bigger Than Bigger”这个口号的翻译。中国大陆版本被译成“比更大还更大”,被广为吐槽,只做到“信”。香港版本的翻译“岂止于大”就备受好评。

机器翻译应该会很容易翻译出“比更大还更大”这样的结果,而要翻译出“岂止于大”这样具有信达雅风的语句自然还需要时间。

好在百度、Google等公司都在翻译上投入大量资源,基于计算机、语言学等多种交叉学科不断在取得突破。人工智能的技术基石正在快速发展,给机器翻译带来了新的契机。

未来NLP技术如果能在如何学习理解人类语义方面取得更多技术突破,机器翻译取代越来越多的人工翻译岗位,或许并非痴人说梦。