機械翻訳の人間によるポストエディット
近年、機械翻訳技術は目覚ましい進歩を遂げていますが、熟練した人間の翻訳者の判断力に取って代わることはまだ不可能です。Trusted Translationsでは、人間の翻訳者が機械翻訳のポストエディットを行うことで、この 2 つが連携して最もうまく機能すると認識しています。
機械翻訳の人間によるポストエディット
近年、機械翻訳技術は目覚ましい進歩を遂げていますが、熟練した人間の翻訳者の判断力に取って代わることはまだ不可能です。Trusted Translationsでは、人間の翻訳者が機械翻訳のポストエディットを行うことで、この 2 つが連携して最もうまく機能すると認識しています。
機械翻訳関連コンテンツ
正確な機械翻訳には人間によるポストエディットが不可欠な理由
機械翻訳は人間翻訳と同じレベルに達したのか?そうではありません—人間の介入が不可欠です。機械翻訳の精度と有効性は、言語の組み合わせ、コンテンツ ドメイン、複雑さと技術レベル、コンテンツが平凡かクリエイティブか、ソース コンテンツがどれだけ適切に記述されているか、入力形式など、さまざまな要因に左右されます。
こういった要素のバリエーションは無限にあるため、機械翻訳はすべての言語のニュアンスを汲み取って、あらるゆ場面で正しい翻訳を生成することはできません。ほとんどの場合、機械翻訳を利用する際に信頼性の高い翻訳出力を保証するには、人間によるポストエディットが不可欠です。さらに、カスタム ニューラル機械翻訳エンジン (CMTE)を使用している場合は、パフォーマンスを改善するため、再トレーニングを行うにあたり、人間の翻訳者からのフィードバックが必要です。
Trusted Translationsには、機械生成翻訳のポストエディットに特化したトレーニングを受けた専門の翻訳者がいます。弊社の熟練したポストエディターは、機械または自動翻訳出力を使う経験を活かして、機械翻訳の修正を行うだけでなく、将来的な出力改善に取り組んでいます。
適切なテクノロジー ツールを導入すると、ポストエディット プロセスによって現在の翻訳プロジェクトの出力品質が向上し、その品質データを翻訳メモリ (TM) に保存できるようになり、将来的なプロジェクトのための機械翻訳エンジンの効率と精度も向上します。
翻訳とポストエディットの手順
翻訳のプロセスと機械で生成されたコンテンツをポストエディットするプロセスはまったく異なり、それぞれ異なるスキルとトレーニングが必要です。すべての翻訳者がポストエディットに向いているとは限りません。たとえポストエディット業務に登録しても、手順がわからず、ある程度の訓練を必要とするでしょう。
学界ではごく最近、人間のポストエディターに対する高まる需要に対処するためのカリキュラムの開発を開始しました。すべてはバイリンガル コンテンツを確認するときに活用される頭の中のプロセスから始まります。コンテンツを一から翻訳する場合、真っ白なキャンバスである「ターゲット」(訳文) を埋めるには、通常、翻訳者は次のステップに従います。
- まず、原文を注意深く読みます。
- そして、頭の中で翻訳を作成します。
- 最後に、作成したターゲット言語(訳文)をソフトウェア プログラムまたはインターフェイスに入力します。
コンテンツとプロジェクトに応じて、翻訳者はすぐにテキストを編集したり、追加の調査を行ったりする場合もありますし、テキスト全体を翻訳した後に見直すこともあります。
しかし、機械翻訳されたコンテンツのポストエディットでは、プロセスが大きく異なり、通常はコンピューター支援翻訳ツール (CATT) を使用して行います。
- まず、ポストエディター(翻訳者)は、MT 出力の文またはセグメントを確認します(つまり、ターゲットから始まります)。
- 次に MT 出力と原文とを比較します。
- ポストエディターは、言語知識と明示的な指示に基づいて、MT 出力の品質に関して即時判断します。
- MT 出力が許容できるものである場合、テキストを改善するための努力を続けます。
- MT 出力の品質が低い場合、MT からの訳文をすべて削除し、最初から再翻訳します (上記の翻訳プロセスと同じです)。
機械翻訳のポストエディット プロセスの一部として、プロジェクトには翻訳メモリ (TM) が含まれることがよくあります。この翻訳メモリには、通常お客様や他の類似プロジェクトからの、以前に行われた類似/関連資料の翻訳ジョブの翻訳セグメントが含まれています。TM に含まれる、これら以前の翻訳済みセグメントは、ファジー (あいまい) マッチまたは、現在の原文のセグメントと完全マッチしている場合があります。TM の内容を見て、編集者はこれらの以前の翻訳セグメント全体を使用したり、必要な調整を行ったりできます。
人間によるポストエディットと人間翻訳
人間翻訳をレビューする場合と比較して、機械生成の翻訳を編集するには、非常に異なるアプローチとスキルセットが必要です。
一般に、人間翻訳で見つかるエラーの種類は、機械翻訳されたテキストで見つかるものとは大きく異なります。たとえば、数値を置き換える場合、機械翻訳のほうが正確になる傾向があります。また、マシンエンジンなら、コンテンツの訳抜け(例: 長い法律パラグラフ内の条項を省略する等)が起こりにくくなります。しかし、機械翻訳では、ぎこちない響きのフレーズが作成されることがよくあります。一部の MT エンジンは、用語集を使用しても、非常に低いパフォーマンスしか発揮しません。
人間翻訳であれば、数値を翻訳する際にエラーが発生したり、内容を省略してしまったりする可能性が高くなります。翻訳者の中には、意味を明確にしようとする際に、原文から逸脱した内容を追加する人もいます。ただ、全体として自然な響きの訳文を作成する面では、人間翻訳がはるかに優れており、文脈や意味的なエラーが少なくなります。
Trusted Translationsでは、これらの違いを認識し、独自のツールを使用して出力を改善するように、機械翻訳のポストエディターをトレーニングしています。さらに、弊社ツールでは、エディターが機械翻訳エンジンを「トレーニング」して将来の出力を改善できるようになっていて、おかしなフレーズを再翻訳するのに役立ちます。
簡単なポストエディットと完全なポストエディット
Trusted Translationsは、万能のソリューションはないと考えており、むしろ、すべてのソリューションをお客様のニーズに合わせます。
品質が求められる場合は、翻訳エンジンの性能だけでなく、出力の使いやすさに応じて必要なポストエディットのレベルも評価します。この場合、完全な (すぐに公開できる) ポストエディットが目標になります。つまり、バイリンガル コンテンツの追加校閲ステップ (たとえば、エディット) を行う場合に、エディターが、MT ポストエディット セグメントと 100% HT (人間翻訳) セグメントとの違いに気づくような翻訳であってはなりません。
コストを抑えたい場合、または時間を重視する場合、および MT 出力の品質が十分に高い場合は、テキストの流れを改善するために簡単なポストエディットのみを行うのがおすすめです。また、スペルチェッカーを使用して主な文法エラーを修正し、用語の使用法を改善します。
ポストエディットとプレエディット
ポストエディットとプレエディットとは、別物です。プレエディットとは、自動翻訳ツールで特定のテキストを翻訳する前の準備段階を指します。プレエディターは、基本的なエラーについてコンテンツを見直し、特定のコンテンツを特定の方法で翻訳する(またはまったく翻訳しない)ようにタグ付けし、フォーマットを最適化します。
この準備を行うと、出力された品質が大きく改善されます。これは、ほとんどの機械翻訳案件または自動翻訳案件において重要なステップと見なされており、ポストエディターが高品質な翻訳をもっと簡単に提供できるようになります。機械翻訳技術が向上し続ける中、高品質の翻訳を提供するためにはプレエディットとポストエディットとの両方のプロセスで必要な人間のスキルを備えることが重要です。
専門の人材からなるチームのサポートを受けて、機械翻訳を強化することに関心をお持ちの方は、今すぐTrusted Translationsにお問い合わせください。