Da asporto chiave
- DALL·E è una nuova rete neurale in grado di disegnare immagini basate su testo.
- La rete è uno di un numero crescente di progetti di intelligenza artificiale in grado di imitare la produzione creativa degli esseri umani.
- Gli esperti affermano che le immagini disegnate dall'IA non sono creazioni originali.
Spostati, Picasso. Una nuova rete neurale può disegnare immagini basate sul testo.
DALL·E, un portmanteau dei nomi dell'artista Salvador Dalí e WALL·E della Pixar, può prendere qualsiasi testo e creare un'immagine da esso. Il sistema utilizza una rete neurale che è stata addestrata su miliardi di immagini ed esempi di testo. È uno di un numero crescente di progetti di intelligenza artificiale in grado di imitare, ma non replicare, la produzione creativa degli esseri umani.
"Poiché il linguaggio naturale è in continua evoluzione e dipende molto dalle sfumature contestuali, insegnare a una macchina a comprendere il linguaggio abbastanza bene da poter disegnare un'immagine è un risultato molto significativo", Tamara Schwartz, professoressa di sicurezza informatica allo York College of Pennsylvania, ha detto in un'intervista via e-mail. "Immagina un disegnatore della polizia, è un talento raro, avendo la capacità di creare un'immagine basata sulla descrizione di un testimone."
Utilizzare i big data per produrre immagini
DALL-E è stato creato dalla società di ricerca sull'intelligenza artificiale OpenAI e funziona accumulando grandi quantità di dati da Internet. I dati vengono quindi elaborati da un modello in linguaggio naturale e addestrati per produrre immagini dal testo. DALL-E funziona in modo simile al GPT-3 recentemente rilasciato, un modello linguistico creato da OpenAI a cui può essere richiesto di generare passaggi di testo originali. GPT-3 è stato addestrato utilizzando mezzo trilione di parole di testo su Internet e può produrre testo sorprendentemente realistico.
Insegnare a una macchina a comprendere la lingua abbastanza bene da disegnare un'immagine è un risultato molto significativo.
Michael Yurushkin, fondatore e CTO di BroutonLab, una società di data science, ha dichiarato in un'intervista via e-mail che DALL-E è "uno dei pochi colpi di successo dell'umanità nell'emulazione della nostra creatività e immaginazione". Ha aggiunto: "È più facile rendersi conto di come l'IA preveda qualcosa esaminando dati rilevanti, ma capire come è in grado di generare disegni da cose di cui non si ha mai sentito parlare prima è più difficile."
Schwartz fa attenzione a notare che l'IA non sta creando informazioni, ma sta piuttosto prendendo dati linguistici e trasformandoli in immagini.
"La creatività iniziale viene dall'essere umano che ha costruito il compito", ha detto Schwartz. "C'è una certa 'creatività' da parte dell'IA, perché sperimenta varie combinazioni di dati e quindi seleziona da una serie di potenziali output. Tuttavia, un essere umano sta esaminando i risultati e insegnando all'IA come selezionare tra le molte combinazioni."
Lavoro di investigazione robotica?
Una macchina può sperimentare questa combinazione di dati e oggetti molto più velocemente di un artista umano. Schwartz ha notato che DALL-E potrebbe un giorno collaborare con un detective che cerca di ricostruire una scena del crimine attraverso uno schizzo, sulla base di una testimonianza oculare.
"Mentre i testimoni forniscono le loro dichiarazioni, il computer potrebbe prendere quelle informazioni parlate e dal linguaggio naturale e creare un disegno della scena, o molti disegni della scena", ha detto. "Queste visualizzazioni potrebbero quindi essere integrate per creare un'immagine più precisa delle prove perse. Questa visualizzazione potrebbe essere arricchita integrando le immagini precedenti del luogo prima del crimine."
Diversi altri programmi basati sull'intelligenza artificiale possono produrre arte. Ad esempio, Ai-Da utilizza un sistema di braccio robotico e una tecnologia di riconoscimento facciale abbinata all'intelligenza artificiale per creare arte. Il sistema può analizzare un'immagine posta davanti alla macchina, che alimenta un algoritmo per produrre i movimenti del braccio del robot.
Tuttavia, gli artisti umani non dovrebbero preoccuparsi che i padroni robotici li sostituiranno, ha affermato l'anno scorso Ahmed Elgammal, direttore dell'Art and Artificial Intelligence Lab presso la Rutgers University, sul New York Times.
"Sebbene la definizione di arte sia in continua evoluzione, al suo interno è una forma di comunicazione tra gli esseri umani", ha scritto. "Senza un artista umano dietro la macchina, l'IA può fare poco più che giocare con la forma, sia che ciò significhi manipolare i pixel su uno schermo o le note su un registro musicale. Queste attività possono essere coinvolgenti e percettivamente intriganti, ma mancano di significato senza interazione tra artista e pubblico."
Dopo aver dato un'occhiata al lavoro di DALL-E, capisco il punto di Elgammal secondo cui le immagini create dall'IA non sono opere d'arte. D' altra parte, sono migliori di qualsiasi arte che potrei creare. Allora, davvero, qual è la differenza?