基于大语言模型的翻译与传统机器翻译

In this article

了解传统机器翻译

要了解大型语言模型 (LLM) 所代表的转变,就必须了解其前身的演变。 传统机器翻译 (MT) 并非单一技术,而是一系列的进步,每一步都解决了先前的局限性,同时也揭示了企业级本地化的新挑战。 机器翻译的发展始于基于规则的机器翻译 (RBMT),这种机器翻译依赖于大量人工编制的语法规则和词典。 虽然 RBMT 系统适用于特定的语言对和领域,但它不够稳定,构建成本高,难以处理语言例外和习惯用语,因此不适用于多样化的全球内容。 下一个重大飞跃是统计机器翻译 (SMT)。 SMT不再使用语法规则,而是使用从分析大量双语文本语料库中学到的统计模型。 与基于规则的机器翻译相比,这种数据-驱动的方法能够生成更流畅、更符合语境的翻译。 然而,SMT 的质量完全取决于现有高质量翻译的可用性,并且在翻译对品牌敏感的企业内容时,它往往难以保证一致性和正确的语气。 最近,神经机器翻译(NMT)通过使用深度神经网络一次性处理整个句子,彻底改变了机器翻译领域。 这种方法在《AI翻译技术的演变》中有所详述,它显著提高了流畅度和准确性,使机器翻译成为更广泛应用的可行工具。 尽管取得了这些进步,即使是复杂的神经机器翻译模型也面临着局限性。 它们通常逐句处理文本,这可能会导致它们忽略更广泛的叙述,从而导致整个文档中的术语和语气不一致。 对于企业而言,品牌声音和技术精度是不可妥协的,这些局限性会带来重大风险。

LLM 翻译革命

大语言模型 (LLM) 的出现标志着翻译技术最新也是最重大的变革。 传统的机器翻译模型专为翻译而设计,而大语言模型则不同,它是一种多功能模型,能够理解、生成和转换文本,从而完成各种任务。 然而,这种多功能性对企业来说是一个关键的区别:通用的通用大语言模型与专为翻译而设计的模型之间的区别。 通用大语言模型虽然流畅,但并未针对企业本地化的独特需求进行优化。 它们可能缺乏技术内容所需的特定领域准确性,如果不在安全的生态系统中进行管理,还可能带来安全和隐私风险。 相比之下,专门构建的解决方案从一开始就是为了应对这些挑战。 这就是 Translated 语言 AI 解决方案的作用。 它不是一个适用于翻译的通用模型,而是一个专门为这项任务设计的专业大语言模型。 它利用整个文档的上下文,提供的翻译不仅在语言上准确,而且在上下文和风格上也保持一致。 这种强大的人工智能集成在我们的 TranslationOS 中,这是我们的 AI 优先企业本地化平台,可以协调整个翻译工作流程。 TranslationOS 将语言 AI 的力量与人类专业知识中独一无二的细微差别相结合。 这是我们“人类与 AI 共生”的核心理念:AI 为专业译员赋能,提升他们的技能,以前所未有的规模提供更高的质量,而不是试图取代他们。

提升语境准确性

专门构建的大语言模型翻译的最大优势在于其能够理解并保留整个文档的语境。 传统的神经机器翻译系统一次只处理一个句子,容易出错,破坏文档的一致性。 例如,在引言中以某种方式翻译的术语可能会在后面的章节中以不同的方式翻译,或者模型可能无法保持法律合同所需的一致、正式的语气。 语言 AI 通过分析整个文档的语境来解决这一问题。 这种全面的理解使其能够:

  • 保持术语一致性:确保关键术语、品牌名称和技术术语从头到尾保持一致。
  • 保持语气和风格:调整输出结果,以匹配文档的特定风格,无论是营销活动的创译风格,还是财务报告的正式准确性。
  • 消除歧义:利用周围信息来正确解释句子级模型可能会误译的歧义词汇或短语。

通过TranslationOS管理的协作工作流程,这一功能得以放大。 在这个生态系统中,人工译员指导和完善AI的输出。 他们的反馈被记录下来,用于不断调整模型,形成良性的改进循环。 这种人类与人工智能的共生关系确保了最终翻译不仅能够捕捉单词的字面含义,还能捕捉其背后的文化细微差别和战略意图,这是单纯的自动化所无法实现的质量水平。

速度和质量基准

对于任何企业解决方案,都必须衡量其表现。 在现代翻译中,这不仅仅是速度问题,还包括输出结果的实际质量和可用性。 多年来,机器翻译评估的行业标准一直是 BLEU 分数,该分数衡量的是与参考翻译的相似度。 然而,BLEU 通常无法捕捉到流畅性和意义的细微差别,而这对于高风险内容至关重要。 如今,更先进的指标可以更清晰地反映真实表现,详见“Comparing MT System Performance”:

  • COMET:一种基于人工智能的指标,通过考虑完整的上下文和含义来评估翻译质量,与人类判断的关联性更高。
  • 编辑时间 (TTE):这是一个实用的现实世界指标,用于衡量专业译员在校对人工智能生成的翻译时所花费的时间。 较低的 TTE 直接转化为更快的项目交付、更低的成本和更高的效率。

通过这些现代化的衡量标准,专门构建的大语言模型翻译展现出其企业价值。 语言 AI 和 TranslationOS 的结合旨在实现大规模的表现。 我们的超可扩展平台支持 200 多种语言,旨在处理全球企业的大量内容,同时不影响质量。 我们专注于反映真正可用性的指标,提供的解决方案不仅速度卓越,还能带来可衡量的高质量结果。

实施注意事项

采用任何新技术都需要仔细规划。 对于基于大语言模型的翻译,企业必须不仅关注AI模型本身,还要关注其运行所在的生态系统。 安全性、合规性和投资回报率 (ROI) 是实施过程中需要考虑的关键因素。 通用大语言模型可能无法满足企业级安全和数据隐私标准,如《通用数据保护条例》(GDPR) 。 相比之下,TranslationOS 等平台为所有翻译活动提供了安全、合规的环境。 该平台旨在与复杂的企业IT基础设施无缝集成,最大限度地减少中断,并确保敏感内容得到最高级别的处理。 对于有独特要求的业务,定制本地化解决方案可以进一步根据特定工作流程定制平台。 从投资回报率的角度来看,对专门构建的解决方案的投资可以带来长期的战略价值。 我们的人类-人工智能共生模型大幅缩短了编辑时间,从而降低了译后编辑成本,并加快了全球内容的上市时间。 特定领域材料的卓越准确性降低了代价高昂的错误风险,并保护了品牌的完整性。 归根结底,企业翻译的未来不在于在人类与机器之间做出选择,而在于找到将两者结合的最佳方式。 在 TranslationOS 这样的综合平台中,专门构建的语言 AI 等 LLM 代表了未来的明确方向。 在未来,技术将赋予人类更多的潜能,创造一个每个业务都能以各种语言与每位客户交流的世界。