기계 번역과 그 잠재적 위험 (1부)

MT scaled

설거지를 하거나 달력을 추적하는 데는 기계를 신뢰할 수 있겠지만, 그러한 기계가 여러분을 대변한다고 믿을 수 있을까요?

교육 및 기술 세계가 ChatGPT와 같은 AI 도구의 잠재력(및 함정)으로 떠들썩해지면서, 종종 복잡한 문제에 대한 솔루션으로 칭송받는 또 다른 도구인 기계 번역(MT)에 대해 자세히 알아볼 때입니다. Google Translate 및 Microsoft Translator와 같은 기계 번역 소프트웨어가 엄청나게 정교해졌다는 사실은 부인할 수 없습니다. 최첨단 신경망과 알고리즘으로 구축된 기계 번역은 수백 페이지에 달하는 기술 전문 용어를 번역하는 것부터 해외에서 음식을 주문하는 데 도움이 되는 모든 작업을 수행할 수 있습니다.

하지만 무언가 잘못되면 어떻게 될까요? 기계 번역에 대한 2부작 중 첫 번째로, 이 포스트에서는 MT의 잠재적 위험에 대해 살펴보겠습니다.

오류는 비참한 오해로 이어질 수 있습니다.

예를 들어, 공항으로 가는 길을 묻거나 익숙하지 않은 언어로 누군가에게 인사하는 것과 같이 단순하지만 잠재적으로 어색한 의사소통의 격차를 해소하기 위해 기계 번역을 사용하는 것을 상상하기 쉽습니다.

그러나 기계 번역 알고리즘은 어조, 문맥 및 숙어를 해석하는 능력이 부족하기 때문에 겉보기에 일상적인 상호 작용을 실제 격렬한 감정으로 빠르게 확대시킬 수 있습니다. 예를 들어, 2017년 10월 페이스북은 한 팔레스타인 남성이 악의없이 개시한 사진 캡션(원래 아랍어 “좋은 아침”(yusbihuhum))을 히브리어로 “공격하다”, 영어로 “그들을 다치게 하다”로 잘못 번역했습니다. 그 남자는 체포되어 이스라엘 경찰의 심문을 받았습니다.

실제로 기계 번역의 치명적인 오류에 대한 한 연구에서 Imperial College London의 연구원들은 MT 알고리즘이 특히 유해한 언어로 어려움을 겪는다는 사실을 발견했습니다. 그러한 언어를 잘못 번역하는 경향이 있을 뿐만 아니라 원래 문장에는 전혀 없는 유해한 내용과 공격적인 의미가 도입될 수도 있습니다.

중대한 환경에서의 과도한 의존

종종 비용을 절감하기 위한 조치로 기계 번역을 장려하고 채택하려는 조직의 열의는 중대한 상황에서 특히 위험할 수 있습니다.

예를 들어 Google 번역을 사용하여 응급실 지침을 제공하는 경우, 특히 희귀 언어에서 지속적으로 심각한 오류가 발생할 수 있습니다. 의료와 관련하여 우수한 번역이 얼마나 중요한지에 대해 과소평가하는 것은 불가능합니다. 알레르기 반응, 과다 복용 및 기타 잠재적으로 치명적인 결과를 피하기 위해 측정, 복용량, 지침, 증상 등은 모두 한치의 오차도 없이 정확하게 전달되어야 합니다.

정부 조직 또한 오역이 엄청난 영향을 미칠 수 있는 부문에서 기계 번역을 이용합니다. 2022년 말, FEMA는 알래스카 원주민 커뮤니티에 재해 구호 제공을 위해 기계 번역을 사용했던 회사를 해고했습니다. 위험한 태풍의 여파 속에서 긴급 구호 대신 이누피아크와 다른 언어를 구사하는 사람들이 대면한 문구는 “당신의 남편은 북극곰입니다. 마른 체형”이었습니다.

법 집행 기관이 기계 번역을 사용하는 것도 까다로운 법적 문제를 일으킬 수 있습니다. 예를 들어, 2017년에 지역 경찰은 스페인어를 구사하는 운전자에게 차 수색을 하겠다는 말을 하기 위해서 Google 번역기를 사용했습니다. 그러나 그러한 Google의 ‘충분히 좋은’ 번역이 법적 수색을 진행하기에 충분하지 않았다고 판결하고 그 사건을 기각하였습니다.

기계 학습 도구와 윤리적 딜레마

마지막으로 기계 학습 도구의 급속한 발전은 그 자체로 몇 가지 윤리적인 의문을 제기합니다. 연구자들은 하나의 대형 AI 모델을 교육하면 626,000파운드 이상의 CO2가 배출될 수 있음을 알게되었습니다. 이는 일반 자동차 평생 배출량의 거의 5배입니다! 인간 번역가를 고용하는 것이 비용적으로는 효율적이지 않은 것처럼 보일 수 있지만, 지속 가능성을 우선시하는 회사라면 그것이 가장 나은 선택일 수 있습니다.

동시에, 이 기술을 구동하는 알고리즘은 종종 저임금 “마이크로 노동자”의 보이지 않는 노동에 의존하는 경우가 많습니다. 이들은 주로 개발 도상국에서 공개적인 자료를 제거하고 결과 순위를 매기며, 기타 지루한 작업을 수행하여 알고리즘을 훈련하는 노동자입니다. 기계 학습 도구가 실제 사람과 동등하다고 우리를 설득 할 수 있지만 실제로는 엄격한 인간의 감독과 인간의 입력 없이는 작동하지 않습니다.

기계 번역을 사용해야 합니까?

기계 번역의 위험은 이것이 인간 번역의 정확성과 문화적 노하우를 거의 대체할 수는 없더라도 기계 번역을 절대 사용할 수 없다는 것을 의미하지는 않습니다. 2부에서는 이러한 문제 중 일부 문제를 피할 수 있는 방법에 대해 알아보겠습니다. 그 동안, 가장 좋은 방법은 기계 번역을 편집하는 데 도움을 주는 전문 언어학자를 포함하여 고품질의 인간 번역 서비스를 보장하는 회사와 파트너 관계를 맺는 것입니다.