Machine translation e slang: nuovi approcci e possibili applicazioni

A tutti gli addetti ai lavori sembrerà sicuramente un abbinamento quantomeno bizzarro. I motori di traduzione automatica hanno fatto passi da gigante negli ultimi anni, perfezionando e affinando la loro precisione nel corso della conversione linguistica. Ma se un difetto più di altri ha mantenuto la sua presenza fin dagli albori della machine translation è senza ombra di dubbio la difficoltà di questa tecnologia nel gestire i contenuti più creativi, e quale linguaggio è più creativo dello slang?

Chi segue le nostre pubblicazioni sa bene come la machine translation rappresenti ad oggi uno degli strumenti più utili del linguista. Tempo fa abbiamo affrontato la tematica dell’uso dei CAT Tool nei nostri campi di specializzazione: la traduzione brevettuale, tecnica, medico-farmaceutica e legale.

In questi testi veniva sottolineata l’utilità di questa tecnologia nel ridurre i tempi e in special modo i costi legati ai servizi di traduzione. Analizzando inoltre i vantaggi in termini di accuratezza e coerenza terminologica intra e intertestuale.

Tuttavia, è opinione diffusa che questi strumenti non riescano ad analizzare, e quindi gestire correttamente, gli aspetti più astratti e figurati del linguaggio umano.

Un gruppo di ricercatori dell’Università di Toronto ha deciso di mettere alla prova l’intelligenza artificiale, e la machine translation, con uno dei linguaggi gergali più creativi e complessi: lo slang.

Machine translation e slang

Ma attenzione a non cadere in errore, lo slang può risultare molto difficile anche per i traduttori umani. Non sempre, infatti, il linguista conosce e comprende pienamente questo linguaggio, nonostante possa contare su un’alta preparazione e conoscenza delle due lingue oggetto di traduzione. Questo perché la lingua muta molto rapidamente, influenzata da nuove realtà, nuovi parlanti e nuovi concetti.

È nota a tutti, per fare un esempio, la difficoltà intrinseca della comunicazione intergenerazionale. Comunicazione nella quale i giovani tendono a prendere le distanze utilizzando una terminologia, e in alcuni casi una fraseologia, del tutto originale.

Ciononostante, in questi contesti un parlante, o nel nostro caso un linguista, potrà servirsi delle sue doti interpretative estrapolando la corretta semantica dal contesto e da altri fattori chiave della comunicazione umana.

Lo stesso, però, non si può dire dei sistemi di traduzione automatica.

“Il gergo è una forma predominante di linguaggio informale che consente una maggiore flessibilità nell’uso delle parole; il che lo rende difficile da interpretare per i sistemi di machine translation”, scrivono i ricercatori. 

“Gli approcci esistenti all’interpretazione gergale tendono a fare affidamento sul contesto, ignorando le estensioni semantiche comuni nell’uso delle parole gergali”.

Lo studio

Nel documento pubblicato dai ricercatori si evidenzia come interpretare il significato di un dato termine gergale in un momento antecedente la traduzione del segmento possa rendere l’output MT più accurato. I ricercatori portano ad esempio la forma gergale inglese “steamed”, che può significare “arrabbiato” o “nervoso” in determinati contesti. Utilizzando il motore di Google Translate per tradurre la frase “I got really steamed when my car broke down” in francese, si ottiene la frase “J’ai vraiment pris de la vapeur quand ma voiture est tombée en panne”.

L’output mostra come il motore abbia male interpretato il termine gergale, traducendo letteralmente il concetto originale di “steamed” legato al vapore.

La machine translation, infatti, nel tradurre le forme gergali, ad esempio lo slang, si serve del contesto semantico. Ciò significa che il programma utilizza i segmenti del testo per determinare il significato più probabile, parafrasando l’input. I ricercatori sostengono che un approccio semanticamente informato, ovvero un approccio che tenti di collegare il significato convenzionale con il significato gergale, possa essere il mezzo più efficace per tradurre e interpretare il significato di alcune forme gergali.

“La natura flessibile dello slang è un segno distintivo del linguaggio informale. E, a nostra conoscenza, abbiamo presentato il primo quadro di principio per l’interpretazione automatizzata dello slang che tiene conto sia delle informazioni contestuali che delle conoscenze sulle estensioni semantiche dell’uso dello slang”, concludono i ricercatori.

Se gli obiettivi venissero raggiunti come auspicato, il progetto rappresenterebbe senza dubbio una forte svolta nel mondo della traduzione. Implementando maggiormente la funzione dei motori di traduzione, rendendoli sempre più il miglior alleato del linguista.  


Foto da Pexels