In un mondo sempre più globalizzato in cui i ritmi accelerano di giorno in giorno, non c’è dubbio che la traduzione automatica abbia effettivamente un futuro. Nonostante le risatine suscitate dalle traduzioni automatiche, le app linguistiche basate su reti neurali (sistemi informatici interconnessi che simulano i processi di pensiero umani) restano tutt’ora imbattibili per velocità (istantanea) e costo (gratuito).
Tuttavia, neanche i più sofisticati algoritmi messi insieme sono in grado di sostituire il cervello umano, risultando di gran lunga meno sensibili al contesto e ai modi di dire (piove che Dio la manda) rispetto ai traduttori professionisti.
Veloce, gratuita e difettosa (ma in evoluzione)
Grazie all’influenza di organizzazioni internazionali (come le Nazioni Unite) e di istituzioni multilingue (come il Parlamento Europeo), negli ultimi cinquant’anni sono stati realizzati imponenti database con imponenti quantità di dati paralleli. Tuttavia, è stato solo durante il secondo decennio del XXI secolo, con l’avvento delle reti di deep learning, che è stato possibile trovare un utilizzo pratico per tutta questa documentazione tradotta dall’uomo.
Utilizzando questi imponenti tesori linguistici, alcuni dei principali attori della tecnologia hanno sviluppato piattaforme di traduzione gratuita, come:
- Google Translate: (133 lingue) Vi accedono ogni giorno più di 500 milioni di utenti. Le lingue utilizzate con maggior frequenza sono inglese, spagnolo, arabo, russo, portoghese e indonesiano, mentre agli ultimi posti si classificano bengalese, haitiano, creolo e tagico;
- Microsoft’s Bing Translator: (103 lingue) Si tratta di un servizio cloud che fa parte dei Microsoft Cognitive Services, integrati in numerosi prodotti, inclusi Bing, MS Office, Edge, Skype e Windows, nonché nei dispositivi Apple e Android;
- DeepL: (28 lingue) Attualmente questo motore partito dalle lingue europee si sta espandendo per includere lingue da tutto il mondo; si basa su un immenso corpus di frasi, modi di dire e informazioni tradotte da professionisti e contenute nel dizionario online Linguee.
Ampliare la portata
Questa dipendenza iniziale dalle miniere d’oro digitali di dati paralleli spiega perché la traduzione automatica attualmente includa lingue europee come il finlandese (parlato da cinque milioni di persone) e ignori i 48 milioni di etiopi che parlano oromonico. Altre lingue importanti che ancora ristagnano nel limbo tecnologico includono il bhojpuri (parlata da 51 milioni di persone), il fulah (24 milioni), il sylheti (11 milioni) e il kirundi (9 milioni).
Tuttavia, la situazione sta cambiando grazie all’aggiunta di lingue che ampliano la gamma delle traduzione automatiche. Come ha fatto notare Carl Rubino, program manager di IARPA (l’Intelligence Services Research Center degli USA), “Molte delle sfide che affrontiamo al giorno d’oggi, come l’instabilità economica e politica, la pandemia da Covid-19 e i cambiamenti climatici, trascendono il nostro pianeta e sono pertanto multilingue per natura”.
Salvare vite attraverso le lingue
Poiché queste difficoltà spesso gravano più pesantemente sulle comunità svantaggiate meno equipaggiate per affrontarle, la possibilità di comunicare in modo istantaneo ma accurato sta diventando rapidamente una questione di vita o di morte. Mentre la produttività dei traduttori umani è vincolata a limiti fisici, i computer sono in grado di lavorare 24/7 a velocità strabilianti. Sono in grado di sfornare flussi ininterrotti di analisi, resoconti e linee guida, magari grammaticalmente imperfetti, ma adatti allo scopo in tempi di emergenza limitati.
Questo è il vero valore dell’estensione della portata della traduzione automatica. Facilitando la comunicazione istantanea e abbattendo barriere linguistiche e culturali quando ci sono in gioco vite e mezzi di sostentamento, questi algoritmi senza volto gettano un’ancora di salvezza alle comunità tecnologicamente meno avanzate che combattono per sopravvivere in condizioni avverse.
Lingue con risorse scarse
Benché parlate da milioni di persone, molte lingue dispongono di risorse scritte limitate (e spesso monolingue), a dispetto di una ricca tradizione orale. Per le reti di deep learning queste lingue, così come sono note nel settore, costituiscono un ostacolo difficile da affrontare. Nel frattempo, la gente che le parla continua a caricare post e blog che potrebbero garantire la sopravvivenza di tali culture, nonostante la loro tradizionale carenza di testi e documenti.
Dal punto di vista storico, le fonti multilingue di alcune di queste culture erano spesso limitate a set di dati ristretti forniti dalla letteratura religiosa, in particolare libri sacri ampiamente tradotti, come il Corano e la Bibbia. In tempi più moderni la stampa, i media audiovisivi e i social network stanno creando solidi inventari di dati monolingue che le reti di deep learning possono analizzare e tradurre.
I social network creano reti di sicurezza nelle comunità
I moderni modelli di reti neurali possono essere addestrati anticipatamente utilizzando fonti monolingue orali e scritte. La teoria è che i modelli neurali abbiano appreso alcune caratteristiche e strutture del linguaggio umano, stabilite tramite parametri che ora vengono applicati nella traduzione.
Grazie a utenti di tutto il mondo che postano contenuti spesso ripetitivi oltre i confini culturali e nella propria lingua madre, ora i modelli neurali sono in grado di riassumere testi per gli utenti. Per farlo, sembra che tali app necessitino di pochissimo addestramento bilingue da dati paralleli: sono sufficienti poche centinaia di migliaia di parole (una mezza dozzina di racconti).
In sintesi: Con qualcosa come 7.000 lingue parlate in tutto il mondo (di cui solo circa 4.000 delle quali scritte), le app di traduzione virtuale dispongono di vasti campi in cui espandersi. Dalla sanità all’agricoltura, colmare le lacune linguistiche e culturali tramite la traduzione automatica è chiaramente la strada verso un futuro migliore per l’umanità, ma sempre con l’aiuto di traduttori professionisti, esperti non solo in più lingue ma anche in più culture.
Immagine di Yatheesh Gowda da Pixabay