Iniziamo con una doverosa definizione: la linguistica dei corpora è il settore linguistico nel quale, servendosi di strumenti di analisi statistica, sono studiate e verificate le regolarità terminologiche e discorsive che emergono dai testi oggetto di studio. Il principale obiettivo è quindi quello di costruire modelli capaci di rappresentare il funzionamento del linguaggio umano.
Fino ad oggi, questa branca della linguistica ha visto la sua applicazione principale nello studio interlinguistico dei sistemi comunicativi umani. Ad esempio, nell’addestramento dei motori di traduzione automatica su base statistica.
Un rapporto pubblicato dallo studio legale Bradley Arant Boult Cummings LLP, suggerisce però come questa disciplina possa rivestire un ruolo di rilievo all’interno dei tribunali.
Come già menzionato in alcuni nostri articoli precedenti, (p. es. LE TRADUZIONI LEGALI PROFESSIONALI: PERCHÉ AFFIDARSI AGLI ESPERTI), il linguaggio legale e giuridico si caratterizza per la sua terminologia altamente specifica; la cui presenza o assenza all’interno di un testo può far oscillare il pendolo della bilancia.
Nel settore giuridico, radicalmente delicato e preciso, la corretta interpretazione e l’utilizzo proprio dei vocaboli assume quindi un’importanza fuori dal comune. L’utilizzo quindi dei dizionari, anche se specifici per il settore legale, può non essere sufficiente. Perché allora non affidarsi ai corpora linguistici?
Linguistica dei corpora e settore legale
Questo è quanto suggerito dal rapporto sopra menzionato, il quale sottolinea come la Corte Suprema abbia utilizzato un corpus linguistico nel corso di un caso. Non è la prima volta, tuttavia, che la linguistica dei corpora entra in un’aula di tribunale. Altri processi, infatti, hanno visto l’utilizzo di questi corpora per i casi in cui i dizionari non fornivano una definizione adeguata.
“Resta da vedere se (e come) la Corte Suprema utilizzerà il corpora entro la fine dell’estate, ma questo metodo di interpretazione statutaria sta già comparendo in altri tribunali”, si legge nel rapporto.
Come anticipato, nella linguistica dei corpora, i ricercatori studiano un corpus per osservare l’occorrenza di determinate parole o costruzioni grammaticali in un contesto autentico.
I corpora multilingue vengono utilizzati in particolare nello sviluppo dei sistemi di traduzione automatica, poiché in genere comprendono un gran numero di testi già tradotti in un’altra lingua. In quanto tali, sono stati particolarmente cruciali nello sviluppo di sistemi di traduzione automatica statistica, che creano traduzioni analizzando testi bilingui e determinando la traduzione statisticamente più probabile.
Nel contesto del diritto, inoltre, l’uso dei corpora potrebbe risultare meno complesso dal punto di vista tecnologico, avvicinandosi ai metodi tradizionali della linguistica dei corpora. La Bradley Arant Boult Cummings LLP osserva che l’utilizzo di un approccio basato sui corpora può fornire maggiori vantaggi rispetto all’utilizzo del semplice dizionario, inserendo il termine specifico nel suo contesto.
Questo, però, non significa eliminare i dizionari dal processo. L’utilizzo di corpora può essere utile per identificare le diverse sfumature del discorso, identificando nel giusto contesto la giusta semantica del termine.
In conclusione, lo studio promuove l’uso di queste banche dati per consentire a studiosi di diritto, avvocati e giudici di interpretare più accuratamente il significato di un testo, eliminando ogni possibile fraintendimento.
Foto da Pexels