转发关于机译和人译关系的某篇文章。
一、作者:朱靖波,东北大学计算机学院教授、博士生导师,小牛翻译创始人
看到两位老朋友老崔和翻译驴,还有一位好像从未谋面的翻译乙发表了“对MT的十点胡说”,我也来凑凑热闹,凑几点华为陈总所说的“废话”,中间有玩笑之语,有不当之处,希望谅解。
1.机器翻译最初动机是替代人工翻译,结果遭受ALPAC报告(即美国科学院成立语言自动处理咨询委员会1966年11月公布的《语言与机器》的报告,报告明宣称“在目前给机器翻译以大力支持还没有多少理由”,还指出机器翻译研究遇到了难以克服的“语义障碍”。在ALPAC报告的影响下,许多国家的机器翻译研究进入低潮)棒打一通,从此沉默十多年,痛定思痛,不敢再提此事,认识到翻译不是那么好玩的,只有一群吃瓜群众还经常鼓动搞“颠覆”。
2.从规则方法到SMT再到NMT,机器翻译技术发展越来越快,我估计目前机器翻译水平相当于五年前语音识别技术水平,隐含语是五年以后的机器翻译就像今年的语音识别。
3. 通用的机器翻译系统只是赚个吆喝而已,没有很好的变现能力,真正能够赚到钱的是垂直领域机器翻译应用,因为用户希望得到符合自己口味的机器翻译系统,不愿付钱购买快餐类的机器翻译系统。
4. 从宣传文稿上看,目前最差的机器翻译系统是Google翻译,因为被每家进行残酷无情的碾压,其实最本质的一点是Google翻译不需要靠吹牛来证明自己无法撼动的实力。
5. 目前机器翻译领域最让人迷惑的事情就是业内有很多家排名第一的机器翻译系统,也许世界上本来就只有并列第一或者并列倒数第一。
6. 在残酷市场竞争中,鄙视机器翻译的人工译员在不久的将来可能会被自己鄙视掉。
7. 其实还有99%以上的语言对处于机器翻译沙漠地带,稀缺资源型语言翻译将逐渐成为不可忽视的问题,毕竟技术没有国界。
8. 虽然机器翻译技术发展迅速,但技术壁垒难以形成,学术界高手如云,真正能够形成壁垒应该数据壁垒+行业应用资源+工程打磨积累三者融合。
9. 目前还有争议的是机器翻译到底是否需要语言学知识,将来“需要理解的方法”和“不需要理解的方法”说不定还有一争高低的机会。
10. 机器翻译是否能够形成风口尚未可知,成为一个赛道有可能,爆发趋势已经形成。
二、作者:崔启亮,中国翻译协会本地化服务委员会副主任、对外经济贸易大学国际语言服务与管理研究所副所长
2018年刚开始,1月2日国内资深自由译者娄东来(网名“翻译乙”)通过微博发表了他关于机器翻译(MT)在翻译工作中应用的十点思考。1月3日凌晨,从事人机交互翻译技术研究和开发的黄国平博士(网名“翻译驴”)也通过微博和微信发了关于机器翻译的十点说明。
我对机器翻译的应用很感兴趣,受娄黄两位网文的影响和启发,遂成此文。这篇杂谈不是针对娄东来和黄国平两位观点的回应,而是关于机器翻译在翻译实践应用的个人思考。仅代表个人观点,不代表任何组织。我无意冒犯您,如果哪个观点冒犯了您,那不是我的本心,欢迎与我交流和商榷。
1. 市场和客户是决定如何做好翻译的内在推动力,决定翻译需求的不是译者,而是市场和客户。在市场面前译者和翻译公司都是弱者,客户对翻译质量和交付速度的要求,决定是否使用机器翻译,如何使用机器翻译。
2. 当前机器翻译译后编辑(Post Editing,PE)的工具性能较差,缺少适合译者译后编辑的软件,将影响机器翻译在翻译实践中的应用。提高机器翻译译后编辑的翻译环境,改进机器翻译技术的工程能力,是今后技术实践者的一个方向。
3. 限制机器翻译应用的不是机器翻译技术不成熟,而是译者对新技术的思维意识。早期的鸟儿有虫吃。在机器翻译应用方面,做引领者比做跟随者获得的收益更大。在商业翻译应用看来,没有效率的译者,无法满足翻译交付速度越来越快的要求。
4. 现在的通用机器翻译虽然译文质量比资深译者还有很多差距,但是已经超越很多普通的翻译人员,而且机器翻译深度学习和持续学习的能力超过人类译者。汽车刚发明出来的时候,马车车夫经常嘲笑汽车跑得比马还慢,而且经常抛锚,现在的汽车和高铁速度早已将马车抛在后面。对翻译质量的要求是多层次的,并不是所有译文都要求达到出版级质量,机器翻译更是适合基本信息浏览质量层次的翻译任务。
5. 未来的翻译工作竞争不仅仅是翻译人员与机器翻译的竞争,而且是精通翻译技术的翻译人员与对翻译技术一无所知的翻译人员。机器翻译淘汰不合格的译者,提高高级译者的地位
====
PS1: 最后一句不认同,在外行遍地的中国环境下,大众肯定认为机译是淘汰所有译者,而不是提高高级译者的地位。
PS2: 说机译(在可预见的未来)不会取代人译的,也是这位腾讯机译开发人员黄国平。
PS3:现有机译没有思考能力,我在相关帖子评论中提过多次,也就是上面文章中我标黑的“需要理解”对应的能力。
匆匆重看一遍,来不及查看黄国平在视频的哪一点中说的机译在可预见的未来不会取代人,找到后我打上字幕发上来。
他提到现有的机译复用了不少人工翻译结果(也就是我们所谓由人翻译的句库),是机器自译和人工翻译形成句库复用的混合体。
他对语言知识是否对机译有用也不能给出确定结论。