Meta e l’iniziativa No Language Left Behind: MT in 200 lingue

L’iniziativa presentata dal colosso statunitense è molto ambiziosa: elaborare un modello di intelligenza artificiale (AI) capace di tradurre contenuti da e verso 200 lingue naturali. E come si evince dal nome, No Language Left Behind, Meta vorrebbe poter offrire i propri servizi di traduzione a chiunque nel mondo, indipendentemente dalla lingua parlata.

Non è la prima volta che le ambizioni di Meta, in ambito linguistico, stupiscono il pubblico globale. All’inizio dell’anno abbiamo parlato, all’interno del nostro articolo Il supercomputer di meta per potenziare le traduzioni nel Metaverso, del nuovo sistema di elaborazione capace di eseguire un quintilione di operazioni al secondo.

Lo stupore è destinato a rinnovarsi con la presentazione del nuovo progetto, le cui ambizioni traspaiono già dal testo introduttivo del sito. “No Language Left Behind (NLLB) è un progetto rivoluzionario di intelligenza artificiale primo nel suo genere che rende open source modelli in grado di fornire traduzioni di alta qualità direttamente in 200 lingue. Comprese quelle a basso contenuto di risorse come l’asturiano, il luganda e l’urdu. Mira a dare alle persone l’opportunità di accedere e condividere contenuti web nella loro lingua madre e di comunicare con chiunque, ovunque, indipendentemente dalle loro preferenze linguistiche”.

Ambizione e stupore, dunque, ma vediamo il progetto più da vicino.

No Language Left Behind: gli obiettivi

Come anticipato il nuovo progetto di intelligenza artificiale made in Meta si pone l’obiettivo di abbattere definitivamente le barriere linguistiche degli utenti globali. Ad oggi il principale problema risiede nelle scarse risorse disponibili per alcune lingue, parlate da un numero esiguo di individui e per le quali i contenuti digitali (e in alcuni casi i testi scritti) sono pochi o addirittura non pervenuti.

Come molti di voi già sapranno, per addestrare correttamente un modello di intelligenza artificiale è necessaria una mole non indifferente di dati. La carenza di risorse ha quindi da sempre penalizzato questi sistemi linguistici, favorendo le lingue per le quali è disponibile una vasta gamma di contenuti. Ed è proprio questo il problema a cui il team di ricerca Meta vuole porre rimedio.

Poter usufruire di un servizio di traduzione automatica, sebbene non scevro da errori e traduzioni approssimative, garantirebbe agli utenti di tutto il globo di accedere, ad esempio, a contenuti di informazione come le pagine di Wikipedia e i post social redatti in lingue a maggiori risorse.

Un accesso linguistico innovativo e onnicomprensivo, ma come raggiungere questo obiettivo?

Il Workflow del team di progetto

I ricercatori hanno utilizzato un dataset di riferimento composto da 3001 segmenti per ciascuna lingua, tradotti a partire dall’inglese da traduttori professionisti e madrelingua.

Il dataset è stato quindi utilizzato per confrontare gli output ottenuti dal sistema di AI con le traduzioni proposte dai linguisti. Il metro di paragone utilizzato dal team Meta è il celebre benchmark BLEU, che attribuisce un punteggio qualitativo agli output di traduzione. Tuttavia, sebbene il benchmark permetta di confrontare i progressi dei diversi modelli di traduzione automatica, non offre una misura assoluta della capacità del software di raggiungere la qualità umana.

Il punto di svolta potrebbe risiedere nella già citata human evaluation di Meta. I risultati sono infatti stati integrati con una valutazione umana, fornendo feedback essenziali per l’intero processo.

Inoltre, prima di chiudere, è doveroso citare l’ultimo aspetto innovativo e degno di nota dell’intera iniziativa: sarà in gran parte open source.

Per dirla con le parole di Angela Fan, ricercatrice Meta AI: “penso che sia davvero, davvero importante. Perché una sola azienda non sarà in grado di risolvere in modo olistico il problema della traduzione automatica”.

Credete che questa iniziativa possa essere un punto di svolta? Fatecelo sapere nella sezione commenti dei nostri canali social!


Fonti: The Verge, Multilingual, Meta AI

Foto di fauxels da Pexels



Lascia un commento