Riconoscimento vocale e traduzione: un’arma in più per i linguisti?

Le speech tecnologies, tra cui il riconoscimento vocale automatico (ASR), hanno conosciuto negli ultimi decenni una rapida e continua crescita. Recentemente è stato studiato il suo possibile impatto nel mondo della traduzione.

Teniamo presente che il primo caso di ASR risale al 1952, quando nei Bell Laboratories venne inventato un riconoscitore di cifre chiamato “Audrey”. Pochi anni dopo, nel 1962, IBM introdusse il “Shoebox”, un sistema di speech tecnologies in grado di riconoscere ben 16 parole diverse.

Da allora, il riconoscimento vocale automatico si è sviluppato rapidamente. 

Arrivando ai giorni nostri, sono tantissime le persone che utilizzano questa tecnologia quotidianamente, ad esempio per le ricerche internet dal proprio smartphone, inviare messaggi di testo o interagire con gli assistenti vocali

Ma non solo, negli ultimi anni il riconoscimento vocale automatico è spesso menzionato come strumento per aumentare le prestazioni professionali nella traduzione, post-editing, interpretariato e la sottotitolazione. 

Come riportato da Slator, Dragoș Ciobanu, professore di terminologia computazionale e traduzione automatica all’Università di Vienna, ha pubblicato uno studio sui vantaggi forniti dal questa tecnologia ai traduttori freelance.

Lo stesso studio evidenzia come i linguisti siano più produttivi quando utilizzano le tecnologie di riconoscimento vocale automatico. Sebbene alcuni ne traggano vantaggio implementando l’ASR nel processo traduttivo, altri lo usano esclusivamente per la ricerca in rete o la stesura delle e-mail.

I vantaggi del riconoscimento vocale per la traduzione

Nel corso degli anni diverse tecnologie sono entrate, o si lavora perché ciò accada, nella quotidianità del traduttore. Basti pensare al supporto fornito dai CAT tool o i tentativi di sviluppare tecnologie di eye-tracking ad hoc.

Uno degli aspetti negativi del lavoro del traduttore è sicuramente l’esposizione continuata agli schermi. Molti traduttori corrono il rischio di sviluppare lesioni da sforzo ripetuto, accompagnate da affaticamento eccessivo degli occhi e mal di schiena. L’ASR ha sicuramente il potenziale per affrontare e mitigare queste condizioni.

Inoltre, un altro aspetto positivo delle speech tecnologies è quello di permettere a persone non vedenti o ipovedenti di lavorare nel settore della traduzione.

Un altro studio, che ha indagato gli effetti sulla produttività derivanti dall’integrazione del riconoscimento vocale nel post-editing, mostra come l’ausilio di un sistema di riconoscimento vocale possa migliorare le prestazioni del traduttore, sia in termini di tempo impiegato sia in termini di affaticamento.

Al momento, il principale aspetto negativo di questa tecnologia è il rischio elevato di errori e imprecisioni da parte della macchina. Il linguaggio umano orale comporta numerose sfide per l’ASR, ad esempio la presenza di omofoni, rumori ambientali, intonazione e pronuncia del linguista, possono influenzare negativamente il processo di conversione. Tuttavia, è opinione diffusa che una maggiore attenzione nella fase di revisione testuale possa facilmente eliminare queste problematiche.

In sintesi, l’input vocale aggiunge un’altra dimensione all’attività del traduttore, consentendo al linguista di combinare o alternare diverse modalità di input a seconda della difficoltà dell’attività e delle condizioni di interazione uomo-computer.

Voi cosa ne pensate? Usereste, o usate, le tecnologie di riconoscimento vocale nel vostro lavoro?

Fateci sapere la vostra opinione nella sezione commenti dei nostri canali social! Trovate i link nelle icone qui sotto.


Foto di cottonbro da Pexels