قد لا تحلم الروبوتات، لكنها تهلوس. في ظل تمركز الذكاء الاصطناعي في بؤرة اهتمام وسائل الإعلام مؤخرًا، أصبح ميل التكنولوجيا القائمة على الخوارزميات إلى “الهلوسة” بالمواد هو الشغل الشاغل فيما يتعلق باستخدام الذكاء الاصطناعي، ولا يختلف الأمر بالنسبة لمجال الترجمة الآلية.
في هذا المقال، سنتناول ماهية هلاوس الترجمة الآلية، وسبب حدوثها، وكيفية منع هذه المشكلة الجدية من التأثير على مشاريعك المحتملة في الترجمة.
ما هي هلاوس الترجمة الآلية؟
تستخدم الترجمة الآلية برامج الكمبيوتر – التي تتمثل عادة في الذكاء الاصطناعي أو حلول التعلم الآلي – لترجمة النص من لغة إلى أخرى، على عكس الترجمة البشرية. في حين أن الترجمة الآلية يمكن أن تساعد في توفير الوقت والمال، إلا أنه للأسف يمكن لهذه الآلات أيضًا إنتاج الهلاوس: أي مخرجات ترجمة لا علاقة لها تمامًا بالمدخلات الأصلية (والتي غالبًا ما تكون غريبة).
على سبيل المثال، وجدت إحدى تجارب الترجمة الآلية أن النموذج استخدم قصصًا جديدة تمامًا مهلوسة. فالجملة الأصلية كانت عبارة حول الإضراب المستمر في كولومبيا؛ وبعد اللجوء أولًا إلى خدمة الترجمة من Google إلى اللغة الماراثية ثم ترجمتها مرة أخرى إلى الإنجليزية بواسطة المترجم الآلي، أصبحت العبارة بعيدة كل البعد عن الأصل حيث تتحدث عن الأطفال الأمريكيين الذين يخدمون في شهود يهوه. كما يوضح هذا المثال، يمكن أن تحدث الهلاوس على وجه الخصوص في كثير من الأحيان عند الترجمة من اللغة الإنجليزية إلى لغات أقل استخدامًا، والتي قد لا يتوفر لدى الآلة عنها الكثير من البيانات الموثوق فيها.
لماذا تحدث الهلوسة؟
يتسبب في بعض هلاوس الترجمة الآلية العصبية (NMT) “اضطراب المدخلات”، أو وجود عنصر غير متوقع في المدخلات يؤدي بالتالي إلى تشويه المخرجات. قد تحتوي المدخلات على خطأ مطبعي، أو أسلوب غريب، أو كلمة غير معتادة، أو كلمة لم يتم أخذها في الاعتبار في النموذج.
وقد تنبع هلاوس أخرى من المشكلات الأساسية المتعلقة بالبيانات المستخدمة لتدريب النموذج. وجد الباحثون، على سبيل المثال، أن بعض النماذج تعاني من مشكلات تتعلق بالإفراط في حفظ العبارات، أي العبارات التي تحفظها الآلة لدرجة أنها تريد تكرار تلك العبارات بنفس الطريقة تمامًا في كل مرة، دون التعرف على السياق أو المصطلح. يمكن أن يؤدي وجود قدر كبير من “التشويش” في نصوص بيانات التدريب – أي وجود عدد كبير جدًا من الأزواج الخاطئة أو غير المتسقة بين الجمل المصدر والهدف – إلى الهلاوس.
وعند الحديث عن النماذج القائمة على النموذج اللغوي الكبير مثل ChatGPT، نجد أن الوضع مثير للقلق بنفس القدر. بالإضافة إلى الترجمات غير المطابقة للهدف ومواطن الخلل أو الفشل في الترجمة، يمكن أن تحتوي بيانات التدريب أيضًا على مواد سامة تتسلل إلى مخرجات الترجمة.
كيف تتجنب هلاوس الترجمة؟
كما يمكنك أن تتخيل، يمكن أن تكون هلاوس الترجمة الآلية كارثية على الشركات، حيث تؤدي إلى تراجع ثقة المستخدم والتسبب في إثارة مخاوف أمنية خطيرة. في حين أن هناك طرقًا لمحاولة ضبط الآلات نفسها، فإن الطريقة الوحيدة المجربة والحقيقية لإصلاح الهلاوس بما لا يدع مجالًا للشك هي اللمسة الإنسانية – أي المترجم البشري الحقيقي المحترف.
إن استخدام الترجمة البشرية لا يعني أنه لا يمكنك استخدام الترجمة الآلية كخطوة أولى في مشروع كبير. وبدلاً من ذلك، يمكنك تعيين مترجم بشري لتحسين “المسودة الأولى” للترجمة الآلية في عملية تُعرف باسم التحرير اللاحق. حيث لا يقوم المحررون اللاحقون بمراجعة ترجماتك الآلية وتصحيحها وصقلها إلى مستوى عالٍ فحسب، بل يمكن أيضًا دمج ترجماتهم الجديدة في ذاكرة الآلة نفسها، مما يؤدي إلى تحسين “تدريبها” للمشاريع المستقبلية.
للحصول على أفضل النتائج، يجب عليك البحث عن لغويين محترفين مدربين خصيصًا على التحرير اللاحق للترجمة الآلية، مثل المحررين اللاحقين ذوي الخبرة الذين يعملون لدينا في شركة Trusted Translations، الذين يتبعون إجراءات دقيقة لضمان جودة كل ترجمة.
التقط الصورة Enrique من Pixabay