两种语言之间的翻译关键在于如何仔细构建最能传达原文含义的句子。因此,这并不是从目标语言到源语言的基本逐字切换。而是需要一定程度的灵活性,因为它的翻译是关乎整篇文章的细微差别,而不是各个组成部分的单独含义。
因此,当机器翻译在不断接受培训以及参与翻译的过程中,多年来不断进行改进。为了进一步展示人工智能在处理自然语言方面的能力,研究人员最近训练了一个人工智能来提供有 5000 年历史的阿卡德碑文的近似翻译。
灭绝语言的挑战
最让人感到印象深刻的一点是,当原始语言已经灭绝数千年情况下,与翻译相关的挑战将会被扩大。而阿卡德语就是这种情况,它是一种没有子语言的早期闪族语言。但是这些古语言尤其值得研究,因为通过它们可以让人们深入了解古代社会的生活、政治和信仰。这方面的努力也揭示了我们自己在世界上的历史地位。
阿卡德语的研究,保守估计可归功于考古学家所发现的数十万古文本。虽然其中许多已经数字化。然而,只有少数学者能够理解这些文本。尤其是他们所能理解的内容都是支离破碎的。尽管那些文本是用粘土制作,并且粘土比纸莎草之类的材料可以在几个世纪的时间里保存得更好,但是随着时间的流逝,其中大部分的上下文还是丢失了。
由于文本的破碎性质和普遍缺乏此类语言的专家情况,都增加了翻译的复杂性。雪上加霜的是,翻译这些文件需要大量的时间和人力。
人工智能翻译
为了帮助减轻这些负担,考古学家和计算机科学家团队开发了一种人工智能来翻译阿卡德语。它会根据专为处理该语言而设计的神经机器翻译 (NMT) 模型即时运行。
阿卡德语是所谓的“多元”语言,也就是说,其符号的含义根据它们在句子中的功能而变化。这使得译者只能进行所谓的两步骤的翻译过程。首先,他们会采用原始脚本并使用目标语言的相似发音进行重写,这一过程被称为音译。也就是说,他们使用与原始语言中的单词最接近的拉丁字母来重建单词。此过程的一个常见示例是表示上帝的阿拉伯语单词, الله,翻译过来就是“安拉”。 完成此操作后,他们会将新文本翻译成目标语言。
考虑到这一点,NMT 经过训练可以处理楔形文字及其音译。使用旨在评估机器翻译文本的算法(称为双语评估替补 4 (BLEU4)),该模型的得分分别为 37.47 和 36.52。每个都在高质量翻译的可接受范围内。
虽然 NMT 在许多功能上都存在缺陷。它不能很好地处理较长的句子,并且对比“公式化”,例如法令和记录等体裁,当给予更多的“文学体裁”时,它更容易丢失内容。抛开缺点不谈,它在识别特定类型方面非常准确,这是另一个省时的功能。
在某些情况下,模型会产出大致上看来与所输入文本无关的结果。研究人员将这些称为人工智能的“幻觉”。
共同努力
译者将何去何从?在大多数情况下,机器翻译技术可以提供有用的帮助,实现快速而准确的翻译。可是大部分工作仍然需要由人工翻译人员完成:因为即使机器翻译通过了门槛,也必须进行审核、编辑,甚至彻底修改。目前,这些流程最好人工执行。
目前,研究人员使用的 NMT 模型可以通过在线笔记本访问,源代码已在 GitHub 上以项目名称“Akkademia”提供。 这是任何人都可以使用的技术。通过利用这种 NMT 模型,让学者们翻译古代世界变得更加容易和易懂。
然而,当谈到当今广泛使用的现代语言时,聘请了来自世界各地的专业翻译和语言学家的 Trusted Translations 所提供的服务将在很大程度上满足并超越您的专业翻译需求。
照片由 Bilge Şeyma Kütükoğlu拍摄发布于 pexels.com