기계 번역에 대한 인간 사후 교정
최근 몇 년간 기계 번역 기술이 눈부신 발전을 이뤘지만 아직 숙련된 번역사의 안목 있는 판단을 대체할 수는 없습니다. Trusted Translations에서는 기계가 한 번역을 번역사가 사후 교정하는 방식으로 작업했을 때 가장 효과가 뛰어나다는 사실을 알고 있습니다.
기계 번역에 대한 인간 사후 교정
최근 몇 년간 기계 번역 기술이 눈부신 발전을 이뤘지만 아직 숙련된 번역사의 안목 있는 판단을 대체할 수는 없습니다. Trusted Translations에서는 기계가 한 번역을 번역사가 사후 교정하는 방식으로 작업했을 때 가장 효과가 뛰어나다는 사실을 알고 있습니다.
기계 번역 관련 내용
정확한 기계 번역을 위해 인간의 후편집이 필수적인 이유
기계 번역이 인간과 완전히 동등한 수준에 도달했습니까? 그렇지 않습니다. 따라서 사람의 손길이 반드시 필요합니다. 기계 번역의 정확성과 효과는 언어 조합, 콘텐츠 영역, 복복잡성과 기술 수준 콘텐츠가 평범한지 창의적인지 여부, 소스 콘텐츠가 얼마나 잘 작성되었는지, 입력 형식 등과 같은 다양한 요인에 따라 달라집니다.
이러한 무한한 변형으로 인해 기계 번역이 모든 언어적 뉘앙스를 감지하고 항상 올바른 번역을 생성하는 것은 불가능합니다. 대부분의 경우 기계 번역을 활용할 때 신뢰도가 높은 번역 결과물을 보장하려면 인간의 사후 교정이 필수적입니다. 또한 사용자 지정 신경망 기계 번역 엔진(CMTE)을 사용하는 경우 성능 향상을 위한 재교육 목적으로 언어 전문가의 피드백이 필요합니다.
Trusted Translations에는 기계가 생성한 번역의 사후 교정을 특별히 교육받은 언어 전문가가 있습니다. 당사의 숙련된 사후 편집자는 기계 번역 또는 자동 번역 결과물에 대한 경험을 바탕으로 교정을 제공할 뿐만 아니라 향후 결과물까지 개선합니다.
올바른 기술 도구를 사용하면 사후 교정 프로세스를 통해 현재 번역 프로젝트 결과물의 품질을 개선하고 해당 품질 데이터를 번역 메모리(TM)에 저장할 수 있으며, 향후 프로젝트를 위해 기계 번역 엔진의 효율성과 정확성도 개선할 수 있습니다.
번역 및 사후 교정 프로세스
번역과 기계 생성 콘텐츠를 사후 교정하는 프로세스는 상당히 다르며, 각각 고유한 기술과 교육이 필요합니다. 모든 번역사가 사후 교정을 편안하게 수행하는 것은 아닙니다. 사후 교정 작업을 하는 번역사라 하더라도 종종 교육이 필요합니다.
아주 최근에 학계는 사후 편집자에 대한 증가하는 수요를 해결하기 위해 커리큘럼을 개발하기 시작했습니다. 이 교육은 이중 언어 콘텐츠를 검토할 때 사용되는 정신적 프로세스로 시작됩니다. 콘텐츠를 아무런 사전 지식없이 번역할 때, 백지 상태에서 “대상 언어”(번역될 언어)를 마주하는 번역사는 일반적으로 다음과 같이 작업을 수행합니다.
- 소스 콘텐츠를 주의 깊게 읽습니다.
- 번역을 내적으로(즉, 두뇌에서) 공식화합니다.
- 마지막으로 소프트웨어 프로그램이나 인터페이스에 대상 언어로 된 버전(번역)을 입력합니다.
콘텐츠와 프로젝트에 따라 번역사는 텍스트를 즉시 편집하거나, 추가 조사를 수행하거나, 나중에 전체 텍스트가 번역된 후 다시 돌아올 수 있습니다.
그러나 기계 번역 콘텐츠의 사후 편집 프로세스는 이와 매우 다르며, 일반적으로 컴퓨터 지원 번역 도구(CATT)를 사용하여 수행됩니다.
- 먼저 사후 편집자(언어 전문가)가 MT(기계 번역) 결과물의 문장 또는 세그먼트를 읽습니다(즉, 프로세스가 대상에서 시작됨).
- MT 결과물을 소스 텍스트와 비교합니다.
- 사후 편집자가 언어 지식과 명시적인 지침을 기반으로 MT 결과물의 품질을 곧 바로 판단합니다.
- MT 결과물이 허용 가능한 수준인 경우 텍스트를 개선하기 위해 계속 작업합니다.
- MT 결과물의 품질이 좋지 않으면 MT가 제공한 모든 것을 삭제하고 처음부터 다시 번역해야 합니다(위에 나열된 번역 프로세스에서와 같이).
기계 번역 사후 교정 프로세스의 일부로, 프로젝트에는 일반적으로 클라이언트 또는 기타 유사 프로젝트의 관련 자료에 대해 이전에 작업한 번역의 세그먼트를 수록하고 있는 번역 메모리(TM)가 포함되는 경우가 많습니다. 이처럼 TM에 포함되어 있는 이전에 번역된 세그먼트는 퍼지(근사치)이거나 현재 소스 세그먼트와의 전체 일치일 수 있습니다. 사후 편집자는 TM이 제공한 것을 살펴보며 이전에 번역된 이러한 세그먼트를 통째로 사용하거나 필요한 조정을 할 수 있습니다.
인간 사후 교정과 인간 번역
기계가 생성한 번역을 교정할 때는 인간의 번역을 검토하는 것과는 매우 다른 접근 방식과 기술이 필요합니다.
일반적으로 인간 번역에서 발견되는 오류 유형은 기계 번역 텍스트에서 발견되는 오류 유형과 크게 다릅니다. 예를 들어 기계 번역은 숫자 값을 옮길 때 더 정확한 경향이 있습니다. 기계 엔진은 또한 콘텐츠를 누락하는 경향이 적습니다(예: 긴 법률 문서 단락에서 조항 누락). 그러나 기계 번역은 어색하게 느껴지는 문구도 더 쉽게 생성됩니다. 일부 MT 엔진은 용어집에서도 성능이 매우 떨어집니다.
인간 번역은 숫자 값을 번역할 때 오류가 발생하거나 누락되기 쉽습니다. 일부 언어 전문가는 의미를 명확히 하려다가 소스에서 벗어난 내용을 추가할 수도 있습니다. 그러나 전반적으로 문맥과 의미의 오류가 적은 자연스러운 결과물을 생성하는 데는 인간 번역이 훨씬 뛰어납니다.
Trusted Translations에서는 이러한 차이점을 인식하고 결과물을 개선하기 위해 당사 소유의 도구를 활용하도록 기계 번역 사후 편집자를 교육합니다. 또한 당사의 도구는 편집자가 기계 번역 엔진을 “훈련”시켜 향후 결과물을 개선하는 방식으로 어색한 문구를 다시 번역하는 데 도움이 됩니다.
가볍고 완전한 사후 교정
Trusted Translations에서는 만능 솔루션은 없다고 생각합니다. 대신 고객의 요구에 모든 솔루션을 적용하고 있습니다.
품질에 중점을 둔 경우 번역 엔진의 성능뿐만 아니라 결과물의 유용성에 따라 필요한 사후 교정 수준 또한 평가합니다. 이 경우 완전한(공개 준비가 된) 사후 교정이 목표입니다. 즉, 이중 언어 콘텐츠가 추가 검토 단계(예: 교정)를 거치는 경우 교정자는 MT 사후 교정 세그먼트와 100% HT(인간 번역) 세그먼트 간의 차이를 느껴서는 안 됩니다.
비용이 동인이거나 시간이 핵심인 경우, 기계 번역 결과물의 품질이 충분하다면 텍스트 흐름을 개선하기 위한 가벼운 사후 교정만을 권장할 수 있습니다. 또한 맞춤법 검사기의 도움을 받아 주요 문법 오류를 수정하고 용어 사용을 개선합니다.
사후 교정 및 사전 교정
사후 교정을 사전 교정과 혼동해서는 안 됩니다. 사전 편집은 특정 텍스트에 자동 번역 도구를 실행하기 전에 이와 관련된 준비를 하는 것을 말합니다. 사전 편집자는 기본 오류가 있는지 콘텐츠를 검토하고 특정 콘텐츠를 특정한 방식으로 번역하도록(또는 전혀 번역하지 않도록) 태그를 지정하고 형식을 최적화합니다(예: 원본 파일에서 읽을 수 없는 부분을 완성).
이러한 준비는 결과물의 품질을 크게 향상시키며 대부분의 기계 또는 자동 번역 프로젝트에서 중요한 단계로 간주되어 사후 편집자가 고품질 번역을 보다 쉽게 생성할 수 있습니다. 기계 번역 기술이 계속해서 발전함에 따라 인간 편집자가 신뢰할 수 있는 번역을 생성하기 위해 사전 교정 및 사후 교정 프로세스를 모두 수행하도록 하는 것이 중요합니다.
전문가 팀의 도움을 받아 기계 번역을 다듬는 데 관심이 있다면 지금 Trusted Translations에 문의하십시오.