一般的な (ベースライン) ニューラル機械翻訳ソリューション
Trusted Translationsは、大量の翻訳を生成するために、Google、Microsoft、Amazon、DeepL などの AI リーダーのベースライン機械翻訳 (MT) エンジンおよび翻訳メモリ (TM) サーバーおよび業界で最高品質の大量の翻訳を作成するポストエディットサービスが統合する技術プロセスを開発してきました。
一般的な (ベースライン) ニューラル機械翻訳ソリューション
Trusted Translationsは、大量の翻訳を生成するために、Google、Microsoft、Amazon、DeepL などの AI リーダーのベースライン機械翻訳 (MT) エンジンおよび翻訳メモリ (TM) サーバーおよび業界で最高品質の大量の翻訳を作成するポストエディットサービスが統合する技術プロセスを開発してきました。
機械翻訳関連コンテンツ
合理化されたプロセス
クライアントの要求と仕様に基づいて、ベースライン MT ソリューションを品質管理プロセスと統合し、信頼性や精度の高い翻訳を作成します。この独自のプロセスは、非常に高いレベルの翻訳品質を維持しながら、納期を大幅に短縮し、コストを削減することが示されています。
一般ドメイン機械翻訳エンジン
一般ドメイン機械翻訳エンジン (「GMTE」と呼ばれることもあります) は、人間の介入をほとんどまたはまったく必要とせずにテキストを特定の言語に、または特定の言語から翻訳できるソフトウェア プログラムを指します。これらのベースラインエンジンはそれぞれ異なる方法で構築されていますが、そのほとんどは専門用語を含まない一般的なコンテンツを翻訳するように設計されているため、一般ドメイン機械翻訳エンジンソリューションと呼ばれています。最も人気のあるものは、Google Translate、Systran、Microsoft Translator、Microsoft Hub、および Amazon です。
比較的基本的なコンテンツを全体的に理解するためには、ベースライン エンジンが適切に機能します。ただし、現時点では、カスタマイズされたエンジンには依然として競争力があります。つまり、単純なドキュメントであってもエラーは避けられないため、GMTE だけで作成された翻訳は、専門家が使用するには十分な信頼性がありません。
そうは言っても、クライアントの目的とプロジェクトの性質によっては、GMTE は翻訳プロセスの有用な部分になる可能性があります。Trusted Translationsでは、クライアントのニーズと目標に基づいて GMTE を活用し、統合する方法を学びました。特定のプロジェクトが GMTE をプロセスに組み込むのに適していると思われる場合は、クライアントとそのオプションについて話し合い、GMTE、メモリ サーバー、人間による翻訳 (HT) および校閲のすべての利点を組み合わせたソリューションを設計します。
翻訳メモリ サーバーと一般ドメインMT
GMTE を使用する際に翻訳メモリ サーバー (「TMS」) を使用することは、翻訳結果において全体的な品質を向上させる方法の一つになります。人間が翻訳した従来のセグメントをうまく活用するためです。このようなレガシー コンテンツを使用することで品質を確保できます。これは、クライアント固有のスタイルガイドラインへの忠実度の向上に反映され、用語集が強力な資産にはならない場合にも役立ちます。コンテンツ準備のためのワークフローの可能な構成の1つは、TMS によって最初に翻訳される各コンテンツセグメントで構成されます。この最初のステップで同一または類似のセグメント (完全一致またはあいまい一致) が見つからない場合、コンテンツは一般的な機械翻訳エンジンに送られます。
現在、ほとんどの TMS では、これら 2 つの手順を同時に完了することができます。最後に、翻訳メモリまたは純粋な機械翻訳結果のいずれかから生成されたバイリンガル コンテンツは、専門のポストエディターによって編集される場合もあります。つまり、その MT結果を扱うように特別に訓練された言語スペシャリストによってです。さらに、人によるポストエディットが TMS にフィードバックされるため、次の翻訳の品質が向上します。
一般ドメイン機械翻訳の人間によるポストエディット
GMTE を使用すると、人間のリンギストのみが関与する翻訳プロセスと比較して、翻訳結果の速度を大幅に向上させることができます。十分な処理能力があれば、わずか数日で数億語を翻訳することもできるでしょう。MT と HT の翻訳結果が同等に達したかどうかについての最新の議論に関係なく、一般に、最終的な成果物の品質に何らかの懸念を生じる可能性があります。解決策の 1 つは、ワークフローの一部として、人間によるポストエディットのステップと、場合によっては追加のレビューステップを追加することです。人間によるポストエディットプロセスを統合すると、納期が短縮されますが、その結果、はるかに高いレベルの品質が得られ、GMTE を使用する際、問題分野の特定にも役立ちます。
一般ドメインMTエンジン、メモリ サーバー、および
人間によるポストエディットのワークフロー
機械翻訳ソリューションがまだ開発および改善段階にあることを考えると、 Trusted Translationsは各プロジェクトを独自のケースとしてアプローチします。ただし、私たちの経験に基づいて、機械翻訳をうまく統合するいくつかのワークフローを開発し、テストを実施してきました。以下は、GMTE を翻訳メモリおよび人間によるポストエディット ソリューションと統合する一般的なワークフローです。
上に示したように、コンテンツは API または他のタイプの統合を介してプロセスのすべてのステップを通過します。各コンテンツセグメントは、TMS および一般ドメイン機械翻訳エンジンを通じて、ポストエディット環境に到達します。つまり、当社の翻訳メモリ サーバーおよび/または一般機械翻訳エンジンから出力される各セグメントの結果は、当社のクラウドベースのポストエディット環境で、プロのポストエディターによってオンラインでポストエディットされます。このプロセスは、複数の言語で同時に実行される場合があります。このプロセスは、ポストエディット環境にほぼ瞬時に流れます。人間によるポストエディットタスクから生じるレトロフィードバックにより、TMS の自動更新が生成されます。
一般ドメインMT とカスタムMT の比較
一般ドメインの機械翻訳エンジンを翻訳メモリ サーバーと組み合わせて使用すると、人による翻訳 (ゼロから) とレビューの代わりに人によるポスト エディットを使用することで、コストが大幅に削減されます。納期が劇的に改善されます。このオプションの欠点は、品質がそれほど高くないことと、機械翻訳エンジンには、カスタマイズされた機械翻訳エンジンのように途中で学習して自己改善する動的な能力が欠けていることです。