DALL·E 2 è il sistema di intelligenza artificiale sviluppato da OpenAI capace di ricreare immagini, grafiche e illustrazioni sulla base di un input testuale. Il binomio tecnologia e linguaggio è negli ultimi anni fonte di scoperte innovative e sorprendenti, ma le ultime informazioni relative a DALL·E 2 hanno davvero dell’incredibile. Sembra infatti che questa intelligenza artificiale abbia creato un proprio linguaggio, a noi ancora sconosciuto.
Ma andiamo per gradi.
DALL·E 2 si basa sul linguaggio di intelligenza artificiale OpenAI, sviluppato da Elon Musk, Sam Alttman e Ilya Sutskever. Questo sistema utilizza il modello GPT-3, di cui abbiamo parlato nell’articolo ASTW – INTELLIGENZA ARTIFICIALE ED ESSERI UMANI, per interpretare il linguaggio naturale e creare immagini da un input testuale.
Il sistema DALL·E 2 ha suscitato un notevole clamore nelle ultime settimane per via della sua accuratezza e precisione. Ad esempio, come riportato sul sito di OpenAI, questo modello è in grado di creare un’immagine fedele all’input di partenza “un astronauta a cavallo in stile fotorealistico”; proponendo inoltre versioni differenti della stessa immagine.
Non solo, DALL·E 2 può anche modificare e ritoccare le foto sulla base di un comando testuale, aggiungendo e rimuovendo elementi tenendo conto di ombre, riflessi e texture.
I ricercatori Giannis Daras e Alexandros G. Dimakis hanno recentemente pubblicato un breve documento il cui tema non è però strettamente legato alle funzioni principali di DALL·E 2. Il testo Discovering the Hidden Vocabulary of DALL·E 2, analizza infatti un aspetto del tutto nuovo: il linguaggio nascosto (e sconosciuto) del sistema di intelligenza artificiale.
DALL·E 2: tecnologia e linguaggio
“Sembra che DALL·E 2 abbia un vocabolario nascosto, che può essere utilizzato per generare immagini. Ad esempio, sembra che Apoploe vesrreaitais significhi uccelli e Contarra ccetnxniams luryca tanniounons (a volte) si riferisca a insetti o parassiti. […] Presentiamo il nostro metodo black-box per scoprire parole che sembrano casuali ma hanno una corrispondenza ai concetti visivi”.
L’abstract del documento introduce alla lettura di questa nuova scoperta capace di far luce su aspetti ancora inesplorati della relazione tra tecnologia e linguaggio.
Gli esempi qui riportati non sono gli unici disponibili. Sembrerebbe infatti che la parola (per noi priva di significato) “Vicootes” venga utilizzata da DALL·E 2 per indicare il concetto legato al termine “verdure”.
I ricercatori mostrano anche come sono giunti a questa conclusione.
Il processo ha inizio interrogando il sistema di AI con l’input testuale “due contadini che parlano di verdure, con sottotitoli”. DALL·E 2 genera quindi l’immagine di due individui in camicia a quadri che parlano tra loro, uno dei due tiene in mano dei finocchi. L’output visivo è inoltre arricchito dalla parola “Vicootes” e da una vignetta testuale contenente la frase “Apoploe vesrreaitais”.
Interrogando poi il modello con la parola “Vicootes” questo genera immagini di verdure. Se invece si utilizza la sequenza testuale presente nella vignetta “Apoploe vesrreaitais” l’output mostra immagini di volatili.
L’ipotesi proposta è quindi quella di associare il primo termine sconosciuto alle verdure, e interpretare la vignetta come una conversazione tra i due contadini in merito agli uccelli che interferiscono con le loro verdure. Questa seconda ipotesi risulta alquanto azzardata ed evidenzia come i risultati non siano ancora accurati e precisi al 100%.
Il linguaggio segreto di DALL·E 2 si compone di svariati altri vocaboli e sarà certamente interessante poter scoprire di più sugli aspetti semantici e morfologici a essi legati.
Foto di Kindel Media