Un nuovo documento di ricerca, pubblicato a inizio maggio da Apple, mostra gli sforzi dell’azienda di Cupertino volti a migliorare la traduzione automatica multilingue e a risolvere il sempre attuale problema dei gender bias.
Apple, con i suoi prodotti tecnologici venduti in ogni parte del mondo, è divenuta una delle big tech più note e celebri di sempre. Tuttavia, sebbene sia comune sentirne parlare all’interno dell’ambito informatico e delle telecomunicazioni, non capita spesso di accostare questo marchio al mondo della traduzione.
Generalmente, i volti più noti a cui si pensa quando si parla di machine traslation sono infatti Google e Microsoft. Affiancati nel tempo anche da Meta.
Ciononostante, nel corso degli anni, numerose realtà si sono interessate al settore dei servizi linguistici, sviluppando e includendo all’interno dei propri prodotti e servizi le funzioni di traduzione automatica a loro più affini.
Parliamo, ad esempio, di Amazon e Canva. Due nomi che più di altri possono sottolineare la ormai generalizzata tendenza a consentire un accesso linguistico diffuso agli utenti di tutto il mondo.
Accesso linguistico che, come più spesso sottolineato all’interno del nostro blog, quando è affidato esclusivamente ai sistemi di traduzione automatica presenta ancora oggi insidie e problematiche di diversa natura. I gender bias sono tra questi.
Approfondimenti:
- Gender bias e gli sforzi di Amazon translate
- Il pregiudizio di genere e Google translate: il dataset di Wikipedia
Ed è proprio all’interno di questo quadro generale che si inserisce lo studio sulla traduzione multilingue made in Apple: Learning Language-Specific Layers for Multilingual Machine Translation.
Apple e la traduzione automatica multilingue
Lo studio in questione trae spunto da una consapevolezza ormai diffusa nel settore: i sistemi di MT che usano l’inglese come lingua pivot sono ormai superati.
Volendo approfondire il concetto, è sufficiente soffermarsi sull’idea stessa di lingua pivot, ovvero il sistema linguistico (generalmente l’inglese) utilizzato come fase intermedia della traduzione tra due diverse lingue.
Questi sistemi, quindi, per tradurre un testo (ad esempio in italiano) in una lingua diversa dall’inglese (ad esempio il russo) effettuano prima un traduzione italiano-inglese, per poi effettuare la conversione linguistica inglese-russo.
Com’è facile immaginare, questa prassi comporta spesso tutta una serie di problematiche legate alla duplice conversione. Tra questi troviamo i cosiddetti errori a cascata e la perdita del genere del soggetto (spesso in favore del maschile neutro).
Per ovviare a questi inconvenienti, il progresso tecnologico ha portato alla nascita delle MNMT, ovvero le machine translation neurali multilingue che gestiscono ogni coppia linguistica singolarmente.
Ma come spesso accade, anche le innovazioni più all’avanguardia hanno dei punti deboli. In questo caso, i limiti delle MNMT risiedono nella complessità dei parametri necessari per l’addestramento del sistema, un maggior tempo di latenza e un aumento delle capacità di archiviazione richieste.
La soluzione a questi problemi potrebbe risiedere nella proposta Apple di stratificare diversamente i livelli dell’encoder dei sistemi di traduzione automatica.
L’architettura di nuova concezione includerebbe pesi specifici per ogni lingua e altri condivisi. Alcuni livelli del codificatore sarebbero quindi specifici della lingua di origine o di destinazione, mentre i livelli rimanenti rimarrebbero condivisi. “L’idea è semplice. Invece di condividere gli stessi parametri in tutte le lingue, i pesi per il livello devono essere specifici della lingua”, hanno affermato i ricercatori.
Inoltre, lo studio evidenzia che l’utilizzo di questi sistemi ridurrebbe la presenza di gender bias. Dovuti al passaggio dalla lingua inglese e da un addestramento finora più complesso.
Per maggiori e più complete informazioni consigliamo la lettura integrale dello studio, disponibile al link nel primo paragrafo.
Foto da Pixabay