定制化神经机器翻译研发流程
每种环境都是不同的。我们的第一步是了解客户的内容和目标。您的内容的具体需求是什么?哪种类型的工作流对您的内容和组织有益?您是否有任何我们需要考虑的安全和/或 IT 要求?这些类型问题的答案不仅有助于确定要使用的适当技术,还有助于确定项目的相关流程和成功标准。
定制化神经机器翻译研发流程
每种环境都是不同的。我们的第一步是了解客户的内容和目标。您的内容的具体需求是什么?哪种类型的工作流对您的内容和组织有益?您是否有任何我们需要考虑的安全和/或 IT 要求?这些类型问题的答案不仅有助于确定要使用的适当技术,还有助于确定项目的相关流程和成功标准。
机器翻译相关内容
选择基准引擎
基准引擎是我们构建项目的基础。市场上有几种此类产品,如谷歌、微软、亚马逊甚至苹果,以及其他规模较小但卓有成效的行业参与者。我们与客户合作,确定哪种引擎最适合其需求。为此,我们提供多个 API 以及自动化测试系统,使我们能够根据您的要求为您的内容选择合适的引擎。
数据选择与语料库准备
定制化神经机器翻译引擎均始于查找和利用以前翻译过的内容,这些内容与将要翻译的内容尽可能地相似。可用的已译材料越多,该流程速度越快且更有成本效益。如源语言与目标语言无法作为翻译记忆单元产生联系,则可进行匹配以获取可激发引擎性能的双语内容。
下一步:单语(目标)内容
如已有充分的目标语参考内容,则可通过将其加入混合数据中以结合运用风格类型数据与术语数据。
上一步:来自其他来源的专业语料库
我们还通过网络搜索与通过引擎运行的内容尽可能相似的材料。花时间搜索质量最高的语料库总是值得的。可从数据市场获得的双语数据也是如此。
再训练:借助人工译后编辑完善全新 CNMTE
一种常见的配置是将人工译后编辑集成到这一流程中,以改善结果。在该工作流程中,定制化神经机器翻译引擎产生的译文将由我们的语言学专家进行译后编辑,以提高当前译文的质量,并再次训练该引擎,使其更好地服务于未来的翻译工作。在审校人员对输出结果进行修正的同时,借助动态化适应性模型,引擎也会变得更加智能。此外,随着时间的推移,该引擎处理的翻译越多,就会越加智能化。换句话说,全人工翻译与该解决方案在质量上的差异急剧缩小,而交付周期与成本则显著降低。我们认为,这些翻译引擎对于任何常有翻译需求的客户而言是笔十分珍贵的资产,同时也是一种市场优势。