- 22 Agosto 2022
- Postato da: Stefano Gaffuri
- Categorie: Machine Translation, Tecnologia

Una realtà della quale non abbiamo mai parlato: Amazon e il suo team di Alexa AI ha sviluppato un sistema di machine translation davvero interessante.
Quando si parla di sistemi di traduzione automatica si fa spesso riferimento ai colossi dell’industria, capaci di affermarsi come principali attori del mercato. Parliamo, solo per citarne alcuni, di Google, Meta e Microsoft.
Tuttavia, le realtà interessate ai servizi di traduzione automatica sono davvero numerose. E Amazon, dopo essere diventato uno dei colossi mondiali di maggior rilievo in diversi settori, ha deciso di sviluppare il proprio modello di machine translation.
Nel 2020, ad esempio, la società informatica Intento aveva valutato il servizio di Amazon Translate come il migliore nel tradurre in 14 combinazioni linguistiche.
Inoltre, il team di Alexa AI ha recentemente raggiunto il primo posto per la qualità e fedeltà di riproduzione della formalità testuale.
La machine translation targata Amazon
Nel corso dell’International Conference on Spoken Language Translation di quest’anno, in un task mirato a valutare l’accuratezza nella traduzione di diversi livelli di formalità, il sistema sviluppato dal colosso americano ha sbalordito tutti.
Il modello di machine translation, nella coppia linguistica inglese-giapponese, ha infatti superato il secondo classificato di quasi il 10%.
Ma perché valutare la formalità in un sistema di MT?
Le sfumature del linguaggio umano, come l’ironia e lo slang (di cui abbiamo in questo nostro articolo), rappresentato la principale sfida per le macchine. Infatti, l’elaborazione delle lingue naturali non risiede esclusivamente nelle informazioni grammaticali contenute nel messaggio, ma si arricchisce di informazioni di carattere semantico, culturale e contestuale.
La corretta conversione linguistica, quindi, deve dare il giusto rilievo a ogni aspetto, sia esso testuale o extra testuale.
“I modelli di traduzione automatica (MT) in genere restituiscono una singola traduzione per ogni input, indipendentemente dal caso d’uso previsto o dal pubblico di destinazione”; ha affermato la società tramite un post sul proprio blog il 15 agosto. “Questo tipo di traduzione incondizionata è utile in molti casi, ma non tiene conto delle differenze nell’uso della lingua in diverse parti del mondo”.
Ogni frase e ogni espressione può essere classifica in base a diversi aspetti del linguaggio. Uno di questi è proprio il livello di formalità. Un esempio che meglio di altri può descrivere l’importanza di questa caratteristica testuale è la differenza che intercorre tra un messaggio di testo inviato al proprio amico di infanzia e una mail di lavoro. Nonostante lo scopo possa essere in medesimo, ad esempio organizzare un incontro, e nonostante entrambi i messaggi siano veicolati per mezzo scritto, i termini e le espressioni utilizzati non potranno certo essere gli stessi.
Il risultati dell’International Conference on Spoken Language Translation
Come anticipato, l’attività condivisa proposta dagli organizzatori dell’IWSLT ha premiato il modello di machine translation sviluppato da Amazon, valutandolo come il più accurato.
Nel corso della conversione linguistica, infatti, il sistema di MT ha raggiunto un punteggio di accuratezza formale di poco superiore al 95%, raggiungendo il 100% per i testi di carattere informale.
Punteggio che è stato stabilito sulla base delle metriche di valutazione umana, o human evaluation, di cui abbiamo parlato nel nostro articolo Valutare la machine translation: Meta e le metriche “human evaluation”.
Sempre secondo Amazon “lasciare che il modello scelga tra diverse opzioni valide può portare a traduzioni che utilizzano un grado di formalità inappropriato, che può essere percepito come scortese o stridente per utenti di determinate culture e in determinati casi d’uso, come la chat dell’assistenza clienti”.
In qualsiasi settore, l’ingresso di nuovi attori può tradursi in una maggiore concorrenza, che a sua volta può incentivare l’innovazione e la crescita del settore.
Per approfondimenti: Amazon Science, Intento, Multilingual, IWSLT.
Foto di Christian Wiediger da Unsplash