Tabletes antigos e tradução feita por IA

cuneiform scaled e1690814951311

Traduzir entre dois idiomas significa construir cuidadosamente frases que comuniquem da melhor forma o significado do texto original. Sendo assim, não se trata de uma troca rudimentar, palavra por palavra, entre os idiomas de destino e de origem. Há um grau exigido de flexibilidade calculada, pois estamos falando das nuances do fragmento como um todo, e não do significado individual das partes integrantes.

Esse é um processo que a tradução automática vem sendo continuamente treinada para enfrentar, com melhorias graduais com o passar dos anos. Em outra demonstração do poder da inteligência artificial para lidar com os idiomas naturais, os pesquisadores treinaram recentemente uma IA para fornecer traduções superficiais de tabletes acadianos de 5.000 anos.

O desafio dos idiomas mortos

Isso é particularmente impressionante porque os desafios associados à tradução aumentam bastante quando o idioma original está extinto há milhares de anos. Esse é o caso do acadiano, um idioma semítico primitivo sem idiomas derivados. Vale muito a pena estudar esses idiomas, mesmo que não seja por outra razão além do conhecimento adquirido sobre a vida, a política e as crenças das sociedades antigas. Um esforço que ajuda a esclarecer nosso próprio lugar histórico no mundo.

Estimativas conservadoras atribuem ao acadiano centenas de milhares de textos descobertos por arqueólogos. Muitos já foram até digitalizados. E mesmo assim apenas um punhado de estudiosos consegue entender esses textos. E o que eles conseguem entender é fragmentado, uma grande parte do contexto se perdeu devido aos efeitos degradantes do tempo, apesar de terem sido feitos em argila, que resiste muito mais ao longo dos séculos do que algo como o papiro.

É sua natureza fragmentada que contribui com a complexidade da tradução, agravada pela falta generalizada de especialistas nesses idiomas. Infelizmente, tanto o tempo quanto a mão de obra exigida trabalham contra os esforços de tradução desses documentos.

Tradutores IA

Para ajudar a aliviar essa carga, uma equipe de arqueólogos e cientistas da computação desenvolveu uma IA para traduzir o acadiano. Ela funciona instantaneamente, seguindo um modelo de tradução automática neural (NMT) criado para lidar especificamente com o idioma.

O acadiano é o que conhecemos como um idioma “polivalente”, ou seja, o significado de seus símbolos varia, dependendo de sua função dentro da frase. Isso deixa os tradutores com o que eles chamam de processo de duas etapas. Na primeira, eles pegam a escrita original e a reescrevem usando a fonética do idioma de destino, que possui som semelhante, em um processo conhecido como transliteração. Isto é, eles reconstroem as palavras usando a letra do alfabeto em Latim que produza a palavra no idioma original da maneira mais aproximada. Um exemplo comum desse processo é a palavra em árabe para Deus, الله, que é traduzida como “Alá.” Após isso ter sido feito, eles traduzem o novo texto para o idioma de destino.

Com isso em mente, a NMT foi treinada para lidar tanto com a escrita cuneiforme quanto com sua transliteração. Usando um algoritmo desenvolvido para avaliar textos de traduções automáticas, conhecido como coadjuvante de avaliação bilíngue 4 (BLEU4), o modelo obteve 37,47 e 36,52, respectivamente. Ambos os resultados estão dentro de um intervalo aceitável para uma tradução de alta qualidade.

A NMT fica aquém das expectativas em várias funções. Ela não lida muito bem com sentenças mais longas, e se perde facilmente ao receber “gêneros mais literários,” ao contrário de um gênero mais “convencional,” como decretos e registros. Deixando de lado as deficiências, ela é muito precisa em reconhecer gêneros específicos, mais uma função para economizar tempo.

Em alguns casos, o modelo inventou resultados que aparentemente não tinham absolutamente nada a ver com o texto inserido. Os pesquisadores os chamam de “alucinações” da IA.

Um esforço colaborativo

Onde isso coloca os tradutores? Na maioria das vezes, a tecnologia serve como um auxílio muito útil, apontando para uma tradução precisa e rápida. A maior parte do esforço ainda tem que vir de um tradutor humano: mesmo quando a tradução ultrapassa o limite, ela tem que ser revisada, editada e até mesmo reformulada. Processos esses que são melhor executados, pelo menos por enquanto, por um humano.

No momento, o modelo NMT está acessível através de anotações online, e o código fonte foi disponibilizado no GitHub sob o nome de projeto “Akkademia.” Essa é uma tecnologia que está disponível para qualquer pessoa. Trabalhando dessa forma, com os estudiosos usando tais modelos NMT, traduzir o mundo antigo fica muito mais fácil e mais acessível.

No entanto, quando se trata de idiomas modernos e mais falados nos dias de hoje, serviços como aqueles oferecidos pela Trusted Translations, que emprega tradutores e linguistas profissionais de todo o mundo, irão atender e superar em muito suas necessidades de tradução profissional.

Foto de Bilge Şeyma Kütükoğlu no pexels.com