跨越AI大门,一本翻译蓝皮书、一场人机共译比赛投射出怎样的未来?

news/2024/11/25 13:57:41/

a6b99db4e6911f5b137bece1948e0a6c.jpeg

大语言模型LLM是这几个月热度最高的全球明星。目前看来,AI逐渐走向复杂专业的白领型岗位,已经是必然的趋势。

OpenAI刚刚发布的35页论文中,提到了最容易受到LLM影响的职业中译员和笔译员排名第二。

以前机器翻译就是出国旅游时拍拍路标、看看菜谱,现在GPT-4连学术论文里的复杂长难句、专业术语都能理解,“人肉翻译”越来越没优势。

生成式AI能直接模拟已故的翻译家,输出大师风格的译文,一般人做翻译还有什么前途?

调用ChatGPT翻译一本中等部头的英文书,只需要花大概十个小时、四美元,人工翻译卷到天际也达不到这样的性价比……

这段时间,外语专业学生和翻译从业者们有类似心情的人不在少数。

根据中国翻译协会的调查,中国的翻译人才的规模是538万人,其中本科以上的中青年为主,这些年轻、专业、高素质的人才如果离开了翻译行业,岂不可惜?

所以,我们应该尽快回答这些问题:AI时代,我们为什么还需要人工翻译?翻译人才要怎么跨入AI的大门?译者+机器的人机协作,有哪些必要条件?

幸好,翻译行业的反应速度远比我们想象得快。4月3日至4日,2023中国翻译协会年会举办,百度翻译联合中国外文局翻译院、中国翻译协会翻译技术委员会,共同发布了《2023机器翻译技术及产业应用蓝皮书》。

《蓝皮书》系统阐述了机器翻译的发展历程和方向,介绍了产业级机器翻译系统和产品形式,并通过实际案例展示了机器翻译产业应用现状,对机器翻译未来发展提出建议。为推动机器翻译技术与各行业的深度融合提供有益借鉴,为机器翻译技术的产业应用提供有力支持,其客观、全面、权威的信息,也成为翻译人才把握当下趋势的权威参考。

(《2023机器翻译技术及产业应用蓝皮书》视频简介)

同时,在译协年会上,由百度翻译提供技术和平台支持的“首届全国翻译技术大赛”正式启动,预计赛制持续到8月,也为中国翻译人才拥抱技术提供了竞技舞台和窗口期。

没有人会怀疑,我们正处在一个非常重要的历史转折点。面对大语言模型等最新AI技术带来的无数可能性,中国翻译人才可以不焦虑、不盲目、有底气的进入人机共译新阶段。

26954db89a1f9522986da40349af29eb.png

不焦虑:

“见识过‘珍妮纺纱机’,

我还是选择当翻译”

49f6743bcebbc940611e24167664745b.png

在翻译行业工作多年的小A表示:太阳底下无新事,翻译人见过的“AI威胁论”并不少。

2016年,翻译领域就曾出现过类似的“珍妮纺纱机时刻”。当时,一篇名为《翻译界的重大突破!作为一个翻译,此刻我理解了18世纪纺织工人看到蒸汽机时的忧虑和恐惧!》的文章,传遍了翻译人的朋友圈。

不少译员和外语系学生就像在手工棉纺织时代,看到了由蒸汽机带动的珍妮纺纱机,能同时纺8卷线一样,感到非常担忧。

原来,百度于2015年发布了全球首个互联网神经网络机器翻译系统。随后,谷歌、微软相继部署了以神经网络作为基础的机器翻译系统。这种机器翻译技术,通过建立深度神经网络模拟人类的翻译过程,在语言表示、语义理解、译文生成等方面有显著进步,让机器翻译的质量大幅提升。结果呢?今天人类翻译依然存在,而大众使用翻译服务的门槛则大大降低了。

更早一点,上世纪末的翻译人,也曾遇到过“珍妮纺纱机”。九十年代,统计机器翻译方法的出现,可以基于大规模语料自动训练模型参数,这种方式不需要人工专家来构建翻译规则,比基于规则的机器翻译效率更高、效果更好,弥补了当时国内高水平的专业翻译人才匮乏、不能满足实际需求的问题,让更多高质量的译著走出了国门,走进大众视野。

作为一种更古早的机器翻译技术,基于规则的机器翻译,其实也曾是人类眼中的“珍妮纺纱机”。上世纪五十年代,哪怕穷尽全球翻译家们一生的力量,也只能掌握几十种语言,译著只占人类作品总量的冰山一角,通过计算机自动完成翻译,解决全球沟通和交流的问题,也带来了翻译业态的快速发展。

把时间拉回到当下,以 ChatGPT、文心一言为代表的新一代预训练模型技术,通过超大规模的数据和充分训练实现了智能涌现效应,大幅提升了机器翻译的鲁棒性和容错能力。

57ee71d1ee0e1a0c9db100625fe6d63c.png

所以说,机器翻译从来没有真正消灭人工翻译,这是历史上被多次证明的,反而机器翻译让高质量翻译人才的需求更加旺盛。

面对新的机器翻译技术,翻译人才对于“珍妮纺纱机”的恐惧,更多是源于对于自身发展的不确定。幸好,这种“不确定”正在被“国家队”所改变。

在刚刚发布的《2023机器翻译技术及产业应用蓝皮书》中,中国翻译协会的调研数据显示,有超过 85% 的受访者认为“机器翻译 + 译后编辑”的工作模式会在更大范围内应用。

674f068fd77e2faff6009bf6311a1859.png

《蓝皮书》认为,机器翻译成为人类译员的得力助手和有效补充,促使翻译行业催生出更多如译后编辑、机翻质量控制等新职业,正在多种场景中被应用。

简单举几例:

1.加速短视频、网络文学等中国优质内容出海。人人译视界助力 B 站的海外达人项目,完成三百多个频道的译制工作;晋江文学城、米读小说 APP使用针对网络文学垂直领域定制优化的机器翻译系统,将大量本土网络文学作品翻译成英语、西班牙语、葡萄牙语等语种,获得海外用户的青睐。

2.助力企业海外市场经营。中石化的企业智能翻译平台,支撑境外财务票据核销、重大项目审计、合规备案等翻译工作;新华社的“新华丝路”, 引入智能翻译平台,辅助人工译员提高翻译效率。

3.支撑各行各业数字化建设。译马网引入“AI+人工” 的译后编辑模式,日均翻译字数可提升近 4倍,翻译成本降低 34%;迈迪培尔开发的医药等垂直领域机器翻译,为科研人员的研究工作提供了极大便利。

总之,翻译领域的新机会还有很多,更详细的信息,大家可以在《蓝皮书》中阅览。

机器翻译大有用武之地,高端翻译人才也是时代所需。二者相辅相成,可以满足不同层次的翻译需求,在获取全球信息、对外交流等方面将发挥越来越重要的作用。

作为普通人,要做的是学习驾驭最新的“珍妮纺纱机”,把机器翻译用好,不是留恋做一个“手工纺纱人”。

80a1747fbe58b05f12737c5e78f3785a.png

不盲目:

从朦胧到清晰的人机协作之路

那么,“AI+人工” 的译后编辑工作模式下,究竟怎样才算用好AI技术?人机共译,需要具备哪些技能?

《蓝皮书》提供了方法论,呼吁培养 “翻译 + 技术 +N”的精翻译、懂技术、能力强的新时代高端翻译人才。首届全国翻译技术大赛,则提供了具体的实现路径。

要将AI技术和机器翻译作为得力助手,人类译员想要提高技能,也不能盲目。

“首届全国翻译技术大赛”,由中国外文局、全国翻译专业学位研究生教育指导委员会指导,中国翻译协会、中国外文局翻译院、大连外国语大学主办。百度翻译作为承办单位之一,提供翻译技术与比赛平台支持。

150b68aa44dd66cc5f40d9b40937bd83.png

从阵容中不难看到,赛事为推动行业各方对机器翻译技术的了解和应用,提供了清晰的方向和路径:

1.清晰的培养方向。

举办方是百度翻译,和翻译行业的“国家队”,保证了比赛涉及内容的前沿性和权威性,同时,赛事向各类翻译爱好者开放,高校学生、翻译机构、企业单位等都可以参与,人才覆盖面广。

由此证明,复合型翻译人才的培养,AI+翻译融合学科的建设,离不开政产学研用多方形成合力,提供更充沛的实践机会和更明确的方向引导。

2.清晰的技能标准。

中国的翻译人才要开启“人机共译”工作新范式,需要具备哪些核心能力?比赛考核点的设计,也给出了清晰的答案,让人才能够不再迷茫,提早培养自身的竞争力。

比如以往的翻译比赛,主要考察人类译文的准确性、优美性,而此次比赛,还将对机器翻译的掌握,纳入了考核,包括对机器翻译软件内置功能是否熟悉,操作熟练度如何,是否充分运用了技术,做到真正以赛促学,帮助大家掌握先进的机器翻译工具。

c7a7a0a589cfd76b347244aa22377d11.png

(译后编辑能力考察:术语替换题)

3.清晰的产业基石。

大赛由百度翻译提供技术和平台支持,背后也有着深度的考量:中国翻译综合能力的提高,要建立在怎样的机器翻译底座上?

选择百度翻译,一是技术领先,百度于2015年自主研发的全球首个互联网神经网络翻译系统,能够快速提高翻译产能,是较为先进的机器翻译工具。

二是平台能力,百度智能文档翻译平台的创新人机共译模式,将机器翻译(Machine Translation)+ 译后编辑(post-editing)+ 模型自学习相结合,让机器翻译结果越用越准,效率不断提升。

三是应用丰富。百度智能文档翻译平台,提供术语参考、翻译记忆、智能纠错等功能,内置权威术语,查证更省力,在工作中真正为人类译员减负。

从底层技术到上层应用的优势,是百度智能文档翻译平台“被选择”的原因,也为翻译行业和翻译人才接下来的发展提供牢靠的支持。

翻译人才如何跨入AI的大门,从首届全国翻译技术大赛开始,路径正从朦胧走向清晰。

4080087c76e1ebfa34b14cc22675ead9.png

(产业级机器翻译系统流程图)

有底气:

从一群人的比赛,

到全民的新可能

92f51c6aa9c9b4e857975b1a68f2e0f5.png

你可能会问:我又不当译员,机器翻译的发展跟我又有什么关系呢?

当然有。

从基于规则的机器翻译,到大语言模型驱动的机器翻译,机器翻译技术的每一次更迭,都会让全社会、全世界广泛受益。

你读到的一部译本,与海外朋友的一次对话,境外旅游时的无碍沟通,前沿论文的快速传播……翻译成本不断降低,以前需要请一个翻译,现在手机app/翻译笔就能搞定;体验越来越丝滑,原本要分段复制粘贴的学术论文,现在整个丢进百度智能文档翻译,就能直出全部译文,还带还原版式,阅读效率也高多了。

对于个人来说,跨语言沟通、学习和交流,是成长和进步的基础,通过百度翻译这样的智能产品获得更高质量、更低成本的翻译服务,减少了很多不必要的时间和操作,某种程度上来说,是一种人生的提速。

5c7e6597372af9117c4ebd45f8747406.png

对于企业来说,产品出海或跨境贸易,需要在翻译上投入高成本,有时还不能快速到位,一些翻译相关业务场景需要定制化开发,缺乏相应的人才。

《蓝皮书》中提到国内某世界500强企业,需要通过海外媒体报道和电商渠道的消费者评论等信息,进行海外市场经营决策,涵盖近百种语言,每月翻译需求超百亿词,涵盖文本、文档、图片等多种形态,海量而冗杂的翻译任务,全靠人工根本没办法及时跟进最新市场动向。

中国企业要“走出去”,AI+机器翻译,是必不可少的辅助。

百度翻译从模型到应用的丰富能力,背靠百度生态,可与计算机视觉、语音处理等人工智能技术深度融合,全面、及时、深入响应不同行业不同场景的业务需求。

ba6575c4fc76cf280aba4d9f1b3eec50.png

对国家来说,翻译能力是国家软实力的一部分。

中国外文局局长、中国翻译协会会长杜占元指出,国家翻译能力,是通过翻译行为建构对外话语、开展文化传播、塑造国家形象的综合能力,是文化软实力和国际传播能力的重要组成部分,也是发挥大国作用、提升国际话语权的重要保障。

从这个角度看,加强国家翻译能力建设,除了传统手段之外,机器翻译的技术领先性、安全性、可用性愈发重要。

05e66017737f46643c05418e2323f4b1.png

百度在大模型技术、大语言模型(LLM)、自然语言处理(NLP)方面深耕多年的技术储备和领先实力,从芯片、深度学习框架到翻译模型的核心模块自研能力,让百度翻译有望成为首屈一指的产业级机器翻译系统,在翻译行业智能化、数字经济交流中发挥作用。

这些力量融合起来,才推动中国翻译来到新的转折点。而一个沟通无碍、高效的新世界,会让一个人、一个企业、乃至一个国家,都获得新的机会与可能。

1999年,万维网的发明者、互联网之父Tim Berners-Lee,就曾提出过一个概念:social machine(社会机器),即人与机器的协作体。人负责创造,而机器负责执行。当时,最热的机器是家用电脑,全国都兴起一股“电脑热”,各种电脑培训班、电脑操作书籍纷纷问世,和今天的“AI热”差不多。

如果你不会恐惧电脑、抗拒电脑,那当然也不应该恐惧AI。AI时代,我们仍然需要人类译者,语言的通天塔一天没有越过,翻译的火种便会生生不息。

个人对机器翻译的不同态度和选择,将迎来不同的命运,但愿你的选择,映射的是你的希望,而非恐惧。

b694ceac14f25dd3786491b19ec1dcdf.gif


http://www.ppmy.cn/news/965481.html

相关文章

2023数云原力大会点燃数据资产,共谋金融核心竞争力

5月6日,由国家金融与发展实验室金融科技研究中心学术指导,北京立言金融与发展研究院、神州控股、神州信息、神州数码集团共同主办的2023数云原力大会“数据资产•金融核心竞争力”主题论坛在京盛大举办。金融机构如何更好地发挥数据价值?如何…

勇创世界一流!移动云为我国数字经济发展提供有力支撑

今年2月,中共中央、国务院印发了《数字中国建设整体布局规划》,通过顶层设计及布局,擘画了我国数字经济发展蓝图。近日在国新办举行的第六届数字中国建设峰会新闻发布会上,相关负责人也对我国数字经济现阶段取得的成绩进行了总结&…

第1章信息化发展

广义的信息技术可以追溯到3500~5000年前人类语言的形成和使用,信息技术持续经历了文字的创造、印刷术的发明、电脉冲和电磁的发现与应用、计算机技术发展、新一代信息技术应用等历程。可以看出,信息技术的发展历程,伴随着人类信息沉淀的丰富、…

中国开源创新启示录!

作者 | 郑丽媛、屠敏 出品 | CSDN(ID:CSDNnews) 开源是科技创新的重要模式,也是数字经济发展的底座。2021年,“开源”首次被明确列入“十四五”规划,上升至国家战略层面。2022年1月发布的《“十四五”数字经…

C语言数据结构(链表概念讲解和插入操作)

文章目录 前言一、什么是链表二、链表的优点和缺点三、链表节点的定义四、初始化链表五、链表的插入1.头部插入2.尾部插入3.中间插入 六、遍历链表七、释放链表总结 前言 本篇文章带大家正式的来学习数据结构,数据结构是学习操作系统,和深入C语言必不可…

ChatGPT未来会拥有自我情感和思维吗?

ChatGPT是一种基于人工智能的聊天机器人,它可以模拟人类的对话,并且可以回答各种问题。目前,ChatGPT已经非常先进,但是它是否会拥有自我情感和思维呢? 首先,我们需要明确一点,ChatGPT是一种基于…

Chatgpt使用的是哪种自我监督学习算法

ChatGPT模型使用的自我监督学习算法是基于语言模型的自监督学习方法。具体来说,在训练ChatGPT模型时,使用的是一种被称为「掩码语言模型」(Masked Language Model,MLM)的自监督学习算法。 该算法的主要思路是在示例中…

ChatGPT:机器学习的下一个大步骤

Chatgpt | Chat | Gpt | 小智Ai | Chat小智 | Gpt小智 | ChatGPT小智Ai | GPT小智 | GPT小智Ai | Chat小智Ai 丨 机器学习是人工智能领域的重要分支之一,已经广泛应用于各个领域,例如自然语言处理、计算机视觉、智能推荐等。然而,当前的机器…