L’utilizzo di Google Translate, fin dai suoi primissimi albori, è stato accompagnato da aneddoti e battute inerenti agli errori di traduzione commessi dal sistema di traduzione automatica. Alcuni molto divertenti, altri molto strani, alcuni addirittura pericolosi, poiché esponevano gli utenti a situazioni imbarazzanti, o addirittura disastrose. Ciononostante, la traduzione automatica (MT) si è fatta strada nel corso degli anni nel cuore di molti, compresi i traduttori più scettici.
Ma la machine translation come funziona? Di cosa si tratta? E quanto è cambiata negli anni?
Una possibile definizione di machine translation è, come affermato nel blog di Memsource, una “traduzione automatizzata tramite software “. Da non confondere con l’acronimo “CAT”, per “Computer Assisted Translation”, ovvero uno strumento che aiuta i traduttori a svolgere i propri compiti, suddividendo il testo in blocchi, rendendolo più gestibile e consentendo al linguista di effettuare tutta una serie di azioni e controlli automatizzati.
Quando parliamo di traduzione automatica, il processo si spinge oltre: un software prende il testo originale — meglio chiamato Sorgente —, lo divide in blocchi — meglio chiamati Segmenti — e propone al traduttore i traducenti nella lingua di arrivo — meglio chiamata Target. La traduzione automatica può fornire risultati davvero impressionanti, alle volte senza alcuna interazione umana. Anche se un utente di questi sistemi è tenuto a conoscere molto bene sia la lingua di origine sia quella di arrivo, senza tralasciare la familiarità con l’argomento trattato, alfine di garantire un testo che, quantomeno, abbia senso.
Una panoramica sulla traduzione automatica (MT)
Molti non lo sanno, ma la traduzione automatica non risale alla fine degli anni ’90 o ai primi anni 2000. I primi strumenti per la traduzione automatizzata risalgono agli anni ’50 ed erano più simili a macchine che a computer, spesso basate su sistemi a schede perforate.
Negli anni a seguire, lo sviluppo tecnologico non si è più fermato.
Al giorno d’oggi, parlando di traduzione automatica, coesistono tre diversi approcci.
Il primo è il cosiddetto “basato su regole”: utilizza in sostanza regole grammaticali e linguistiche, servendosi inoltre di glossari che possono essere specifici per un dato settore.
Una traduzione eseguita seguendo questa metodologia prende in considerazione, ad esempio, la posizione del verbo nella frase, l’uso del plurale, l’accordo soggetto-verbo, ecc.
Il secondo approccio è di tipo Statistico: in questo caso, la macchina propone i traducenti, non seguendo le regole della lingua, ma tramite un’analisi comparativa di una grande quantità di traduzioni umane.
I sistemi di traduzione neurale
La terza tipologia viene denominata “MT Neurale”.
Utilizzando una grande rete neurale, il sistema “impara” autonomamente come svolgere una traduzione. Il suo obiettivo, matematicamente parlando, è stimare (non determinare) una distribuzione condizionale sconosciuta P (y|x) dato il set di dati D, dove x e y sono variabili che rappresentano rispettivamente l’input e l’output.
Questi sistemi seguono una sequenza sia per l’input che per l’output, eseguendo e rieseguendo calcoli diversi per ottenere il risultato che meglio si adatta alla rappresentazione finale desiderata del linguaggio naturale.
Seguendo gli ultimi progressi dell’intelligenza artificiale (Machine Learning e Deep Learning) le macchine sono sempre più in grado di ottenere risultati di qualità. Al di là della capacità di calcolo e della sua capacità di archiviare i glossari senza “dimenticanze”, come avviene normalmente negli esseri umani, Machine Learning e Deep Learning rappresentano una tecnologia capace di portare la traduzione automatica al livello successivo.
Oggi consente, ad esempio, vantaggi significativi come diminuzione delle tempistiche, scalabilità ed economicità. D’altra parte, la sola traduzione automatica non sempre risulta adeguata. Ovunque siano richieste creatività, espressioni idiomatiche, adattamento, ecc., una mano umana sul progetto è più che necessaria, è essenziale.
In conclusione, la traduzione umana, o almeno il post-editing, rappresenta ancora il gold standard per la migliore qualità nei servizi di traduzione.
Fonti: Memsource | MemoQ | Gatto intelligente | Padronanza dell’apprendimento automatico |
Foto di Dan Cristian Pădureț da Pexels