鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好
编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好》,文章讲解的知识点主要包括,如果你对科技周边方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。
鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体!
主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。
而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。
ATransAgents公司,每个岗位都配备了30个不同的职工,能够根据语言、体裁和目标受众适配不同的翻译风格。
相比于传统的翻译,产出的译文更加灵活多样,也更符合目标语言的表达习惯,文学性也更强。
所以,TransAgents虽然在以相似度为基础的自动评估中“失败”,却赢得了读者和专业人士的大力肯定。
这样的表现甚至让人感叹说,或许人类对人工智能生成的内容更加青睐的时代,就要来了。
仍然有人表示,TransAgents是证明自己错看了人工智能的又一证据——本以为由于模型限制,小说的翻译对AI会极其困难,结果AI智能体将这个任务完成得非常好。
所以,TransAgents到底有没有那么神呢?
真人和GPT-4都说好
为了评估TransAgents的翻译质量,作者选择了WMT2023数据集,需要对其进行篇章级的文学翻译。
该数据集从12部网络小说中各截取了20个连续的章节,涉及如下八种类型:
- 游戏类(Video Games,VG)
- 东方玄幻类(Eastern Fantasy,EF)
- 科幻爱情类(Sci-fi Romance,SR)
- 当代爱情类(Contemporary Romance,CR)
- 玄幻类(Fantasy,F)
- 科幻类(Science Fiction,SF)
- 恐怖惊悚类(Horror & Thriller,HT)
- 玄幻爱情类(Fantasy Romance,FR)
起初,作者使用d-BLEU进行了自动评估,该方法会与参考样本进行相似度计算,相似度越高得分也就越高。
具体到本项目当中,参考样本一共有两组,样本一是人工给出的翻译结果,样本二是对网络中的双语文本进行对齐后得到。
结果,TransAgents的得分并不理想,只有25分,连SOTA的一半都不到。
但这并不意味着TransAgents的翻译质量不行,而是因为用相似度来衡量文学作品翻译的表现,本身就有失偏颇。
文学翻译不是逐字对照,而是需要在语义、语气、风格等方面进行创造性的转换,这些转换可能导致译文与参考译文在表面上差异较大,相似度不高自然就不意外了。
所以,作者干脆直接让真人(至少10人)来评价翻译的质量,顺便也让GPT-4(0125-Preview)来看了看,在TransAgents、GPT-4(1106-Preview)和真人当中,谁的翻译最好。
测评者会看到针对同一段原文的不同翻译,其中真人只看译文,GPT-4则是原文译文都看。
结果,真人测评者有超过一半都认为TransAgents比人类翻译得更好,8.4%认为两者质量相当,GPT-4也认为TransAgents比自己(和人类)的翻译质量高。
除了这些大众评审之外,两名专业的翻译也认为,虽然人工翻译更加忠实于原文,但TransAgents给出的翻译明显更有文学色彩,更加简洁、在遣词用句上体现出了语言天赋和深厚的文学表现力。
MATTR和MTLD测试指标也证明了这一点,尤其是在MTLD上,TransAgents的语言多样性比真人和GPT-4高出了三分之一左右。
在作者展示的案例中,TransAgents会根据目标语言的习惯对翻译内容做出调整,真人(Ref1)和GPT-4虽然翻的也没错,但相比之下不如TransAgents符合语言习惯。
另外在前后一致性上,TransAgents也超过了单纯使用GPT-4,对相同的原文保持使用一样的译文。
当然,也不是说所有类型它都擅长,在前面提到的8种类型中,TransAgents在游戏、科幻爱情等类型上的表现突出,而在恐怖惊悚等类型上就比较平庸了。
△图中虚线代表50%Win rate
同时作者也发现,TransAgents在翻译时并非“照单全收”,而是会出现一定程度的遗漏现象。
不过从测试中未看过原文的读者给出的评分来看,这样的遗漏似乎没有影响到他们的阅读体验。
所以,这家“翻译公司”是如何运行的呢?
多智能体分工协作
在这个公司当中,不同的智能体分别扮演着CEO、初/高级编辑、真·翻译、本地化专家和校对(Proofreader)这些不同的职位,除CEO外每个职位各有30人,每个人擅长的领域也有所不同,另外还有一个Ghost Agent。
这些智能体由GPT-4-Turbo驱动,每个角色都包含姓名、年龄、职位、工作年限及掌握的语言等多维度的设定。
接到“客户”的翻译要求后,CEO会综合分析原文和目标语言、体裁、目标受众等信息,从几位高级编辑中选择擅长领域最匹配的一位。
此时,Ghost Agent会对CEO的选择进行评估,告知其人选是否合适,从而减少选择失当的现象。
被选定的高级编辑会与CEO合作,再次结合任务需求和个人特点,从公司人才库中进一步选择初级编辑、翻译、本地化专家和校对等团队成员。
团队组建好后,首先由初级编辑逐章节识别所有潜在的关键术语,生成初始术语表,交由高级编辑审查,删除其中的通用术语,生成修订后的术语表,反复迭代直到不需要进一步修改。
然后,结合术语在不同语境下的意义,高级编辑会将术语表中的关键术语翻译为目标语言。
有了术语表后,初级编辑会为每一章生成详细的章节摘要,尽可能保留关键信息和细节,然后还是让高级编辑来审查,并删除冗余或不必要的信息,让章节摘要更加简明扼要。
接着,高级编辑根据修订后的章节摘要编写全书的摘要,概括主要情节、人物和主题,并随机选择书中的一章,分析其语气、风格和目标受众,制定翻译风格指南。
翻译风格指南会发送给项目团队所有成员,以确保译文风格的一致性。
根据风格指南,公司中的真·译员会逐章节进行初步翻译,把初稿交给初级编辑审查,检查是否遵循翻译风格指南,并提出改进意见。
在此基础之上,高级编辑会评估经过修改的译文质量,决定是否需要进一步修改,译员、初级编辑和高级编辑反复迭代,直到译文质量满足要求。
但此时得到的翻译文本并不是终稿,还要交给本地化专家进行调整。专家会识别可能需要文化调适的内容,如习语、隐喻等等,并对这些内容进行调整,使其在保留原文意图的基础之上更贴近目标语言和文化。
调整后的文本会让初级编辑和高级编辑再次审查,确保译文在文化适应性和忠实度之间取得平衡。
这之后,还有校对人员再次检查语法、拼写、标点和格式错误,如果有修改,还要再让编辑进一步审核。
这些流程都走完后,高级编辑会进行最后的终审,重点关注相邻章节之间的连贯性,确保情节、人物、主题等元素在全书范围内保持一致,一旦发现问题则发回给前面的团队成员进行修改,直到形成最终的译本。
如果客户对译本有修改意见,则会再次由高级编辑牵头,组织相关人员进行修改,直到定稿。
不仅是在工作流程上极其严格规范,在客户对译本满意后,高级编辑还会组织项目团队“开会”进行项目总结,分享经验教训。
过程中积累的有价值的术语、翻译技巧、文化调适策略等知识会被整理归纳,上传至公司的知识库,供后续项目参考。
One More Thing
TransAgents已经不是第一个由智能体组成的“公司”了,去年就有来自清华的“游戏公司”ChatDev爆红网络,背后所运用的核心技术就是多智能体。
如果把视线放宽,不只看“公司”,还有斯坦福的AI小镇、清华的AI狼人杀游戏,都在使用多智能体进行着真实人类社会的模拟。
总之随着大模型研究的深入,智能体和群体智能实验已成AI研究最热门方向之一,而且从这次的TransAgents来看,多智能体协同已经开始显现出了实际效益。
(顺便提一句,有网友发现,从斯坦福小镇到ChatDev,再到这次的TransAgents,多智能体研究的作者是真的喜欢《星露谷物语》式的绘画风格。)
当然,也有人对此表示了担忧,认为由AI来主导翻译,会导致语言的同质化,让各种语言中独特的表达消失。
更有甚者,已经跳出TransAgents本身,想到Ilya对大规模Agent合作的恐惧了……
那么你认为在群体智能这条路上还能创造出什么新奇的成果呢?欢迎在评论区晒出你的脑洞。
论文地址:https://arxiv.org/abs/2405.11804
到这里,我们也就讲完了《鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于AI,翻译的知识点!

- 上一篇
- DiffMap:首个利用LDM来增强高精地图构建的网络

- 下一篇
- golang框架开发流程中的常见问题与解答
-
- 科技周边 · 人工智能 | 1小时前 |
- 奇瑞2025年Q1出口突破25万辆,中国车企榜首
- 357浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 加州大学与Adobe推出多模态融合新框架X-Fusion
- 202浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 |
- KlavisAI—开源MCP平台,秒接生产级服务器
- 380浏览 收藏
-
- 科技周边 · 人工智能 | 15小时前 |
- 沃尔沃XC70亮相,SMA混动加持,年内上市
- 236浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 10次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 11次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 10次使用
-
- 可图AI 2.0图片生成
- 可图AI 2.0 是快手旗下的新一代图像生成大模型,支持文本生成图像、图像编辑、风格转绘等全链路创作需求。凭借DiT架构和MVL交互体系,提升了复杂语义理解和多模态交互能力,适用于广告、影视、非遗等领域,助力创作者高效创作。
- 15次使用
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 27次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览