机器翻译是否会产生电子羊幻觉?

forest 7772371 1280

机器人可能不会做梦,但它们确实会产生幻觉。随着人工智能最近成为媒体关注的焦点,基于演算法的技术对材料的“幻觉”趋势已成为人工智能使用的主要关注点,对于机器翻译领域来说也不例外。

在这篇文章中,我们将研究什么是机器翻译幻觉、它们发生的原因以及如何防止这一严重问题影响您的潜在翻译项目。

什么是机器翻译幻觉?

与人工翻译不同,机器翻译使用计算机软件(通常是人工智能或机器学习解决方案)将文本从一种语言翻译成另一种语言。虽然机器翻译可以帮助节省时间和金钱,但不幸的是,这些机器也会产生幻觉:翻译结果产生与原始输入的资料完全无关的内容(而且通常会很奇怪)。

例如,一项机器翻译实验发现,使用该模型所产生的幻觉是生成全新的故事。最初的句子是关于哥伦比亚正在进行的罢工声明;首先通过谷歌翻译成马拉地语,然后由机器翻译器翻译回英语,改声明却变成了关于在耶和华见证人教会中服务的美国儿童的完全错误陈述。正如这个例子所示,当将英语翻译成不太常用的语言时,幻觉尤其容易发生,因为机器可能没有那么多可靠的数据。

为什么会出现幻觉?

一些神经机器翻译(NMT)幻觉是由“输入数据扰动”所引起的,或者是输入数据中的意外元素导致输出结果受到污染。输入资料可能有拼写错误、古怪的书写风格、不寻常的单词或模型中根本没有考虑到的单词。

其他幻觉源于用于训练模型的数据的根本问题。例如,研究人员发现,某些模型存在过度记忆短语的问题,即机器记住的短语太多,以至于每次都想以完全相同的方式重复这些短语,而不识别上下文或习语。训练数据中的大量“噪音”——源句子和目标句子之间有太多错误或错位——也可能导致幻觉。

当谈到像 ChatGPT 这样基于大型语言模型的情况时,结果同样令人不安。除了脱靶翻译和翻译故障或失败之外,训练数据还可能包含混入翻译输出结果的有毒材料。

如何避免翻译幻觉

正如您可以想象的那样,机器翻译幻觉对企业来说可能是灾难性的,尤其会削弱用户的信心并引起严重的安全问题。虽然有很多方法可以尝试对机器本身进行微调,但毫无疑问,解决幻觉的唯一经过验证的方法是由人力介入——一个真正的、专业的人工翻译。

使用人工翻译并不意味着您不能使用机器翻译作为重大项目的第一步。相反,您可以聘请人工翻译人员在称为译后编辑的过程中清理机器翻译的“初稿”。译后编辑不仅会审查和纠正您的机器翻译,将其润色到高标准,而且他们的重新翻译也可以纳入机器本身的内存中,改进其对未来项目的“训练”。

为了获得最佳结果,您应该寻找经过机器翻译译后编辑专门培训的专业语言学家,例如 Trusted Translations专家译后编辑,他们会遵循严格的流程来确保每个翻译的质量。

图片由 Enrique 发布于 Pixabay