Машинный перевод и его потенциальные опасности (часть 1)

MT scaled

Возможно, вы доверяете машинам мыть посуду или вести свой календарь. Но стоит ли доверять им говорить от вашего имени?

В то время как мир образования и технологий бурно обсуждает возможности таких инструментов искусственного интеллекта как ChatGPT (и их подводные камни), пришло время поглубже погрузиться в другой инструмент, который часто называют решением сложных проблем: машинный перевод (МТ). Нет сомнений, что такие программы для машинного перевода как Google Translate и Microsoft Translator стали невероятно умными. Возможности машинного перевода, созданного на основе передовых нейронных сетей и алгоритмов, безграничны. Он может делать все — от перевода сотен страниц технического жаргона до помощи в заказе еды за границей.

Но что будет, если что-то пойдет не так? В этой статье (первой из двух о машинном переводе) рассматриваются потенциальные опасности МТ.

Ошибки могут привести к катастрофическому непониманию

Легко представить себе, как использовать машинный перевод для устранения простых, но потенциально неудобных пробелов в общении — например, если вы спрашиваете, как проехать в аэропорт, или хотите поприветствовать кого-то на незнакомом языке.

Но поскольку алгоритмы машинного перевода не способны интерпретировать тон, контекст и идиоматические выражения, казалось бы обычное взаимодействие может быстро превратиться в реальное насилие. Например, в октябре 2017 года Facebook грубо перевел безобидную подпись к фотографии одного палестинца — «доброе утро» по-арабски (yusbihuhum) — как «напади на них» на иврите и «причини им боль» на английском. Мужчина был арестован и допрошен израильской полицией.

На самом деле, в одном из исследований критических ошибок машинного перевода исследователи из Имперского колледжа Лондона обнаружили, что алгоритмы МТ испытывают особые трудности с токсичным языком. Они не только склонны неправильно переводить его, но даже могут привнести в них вредное содержание и оскорбительный подтекст, которые в принципе отсутствовали в исходном предложении.

Излишнее доверие к МТ в ситуациях высокой важности

Стремление организаций продвигать и внедрять в свои процессы машинный перевод, часто в целях экономии средств, особенно опасно в ситуациях, где ставки очень высоки.

Например, использование Google Translate при переводе инструкций для отделения неотложной помощи постоянно приводит к критическим ошибкам, особенно при использовании редких языков. Невозможно переоценить важность хорошего перевода, если речь идет о здравоохранении. Измерения, дозировки, инструкции, симптомы и многое другое необходимо передать с высокой точностью, чтобы избежать аллергических реакций, передозировки и других потенциально смертельных результатов.

Правительственные организации также используют машинный перевод в тех случаях, когда неправильный перевод может иметь огромные последствия. В конце 2022 года агентство FEMA прекратило сотрудничество с компанией, которая использовала машинный перевод для оказания помощи при стихийных бедствиях общинам коренных жителей Аляски. Вместо того, чтобы оказать важнейшую помощь после опасного тайфуна, носителей инупиакского и других языков ждали смехотворные фразы типа «Твой муж — белый медведь, худышка».

Использование машинного перевода в правоохранительной сфере также приводит к большим проблемам. Например, в 2017 году местная полиция использовала Google Translate, чтобы убедить испаноговорящего водителя разрешить им провести обыск автомобиля. Но суды постановили, что перевод Google Translate, несмотря на то, что он «достаточно хорош», недостаточен для проведения обыска в соответствии с конституцией, и дело было прекращено.

Инструменты машинного обучения и этические дилеммы

Наконец, быстрое развитие инструментов машинного обучения само по себе поднимает некоторые этические вопросы. Исследователи обнаружили, что обучение одной большой модели искусственного интеллекта может привести к выбросам в атмосферу вредных веществ, эквивалентным 626 000 фунтов CO2 и даже более. Это почти в пять раз больше, чем выбросы за весь срок службы среднестатистического автомобиля! Хотя наем человеческих переводчиков может показаться неэкономичным, скорей всего он является более экологичным решением для компаний, которые уделяют первостепенное внимание устойчивому развитию.

В то же время алгоритмы, на которых основана эта технология, часто опираются на невидимый труд низкооплачиваемых «микроработников» — часто людей, живущих в развивающихся странах, которые обучают алгоритмы, удаляя оскорбительные материалы, ранжируя результаты и выполняя другие утомительные задачи. Пусть инструменты машинного обучения пытаются убедить нас в том, что они не уступают реальным людям, в действительности они работают лишь при наличии строгого надзора со стороны человека и его участия.

Стоит ли использовать машинный перевод?

Опасности машинного перевода не означают, что МТ никогда нельзя использовать, даже если он редко идет в сравнение с точным переводом, выполненным силами человека, который учитывает и культурное ноу-хау. Во второй части мы рассмотрим, как избежать некоторые такие проблемы. А пока лучше всего сотрудничать с компанией, которая гарантирует высококачественные услуги перевода, выполненного силами человека, включая услуги экспертов-лингвистов, которые могут отредактировать машинный перевод.