Da asporto chiave
- Un nuovo collettivo di sviluppatori sta costruendo modelli di IA open source.
- Il gruppo utilizza enormi modelli di formazione linguistica che rilascerà con licenze aperte.
- L'IA open source potrebbe aiutare a rendere il potere potenzialmente rivoluzionario della nuova tecnologia meno soggetto a pregiudizi ed errori.
Ci sono molte ricerche sull'intelligenza artificiale da parte di grandi aziende (AI), ma un gruppo online vuole democratizzare il processo.
EleutherAI è un collettivo di ricercatori, ingegneri e sviluppatori volontari di recente formazione incentrato sulla ricerca sull'IA open source. L'organizzazione utilizza le basi di codice GPT-Neo e GPT-NeoX per addestrare enormi modelli linguistici che prevede di rilasciare con licenze aperte.
"I dati open source avvantaggiano i ricercatori perché gli scienziati hanno più risorse gratuite da utilizzare per formare modelli e completare la ricerca", ha detto a Lifewire Edward Cui, CEO della società di intelligenza artificiale Graviti, in un'intervista via e-mail. La sua azienda non è coinvolta in EueutherAI. "Sappiamo che decine di progetti di IA sono stati ostacolati da una generale mancanza di dati di alta qualità da casi d'uso reali, quindi è fondamentale stabilire una guida che garantisca la qualità dei dati, con l'aiuto della comunità partecipante."
Questa è la strada
Gli inizi di EleutherAI furono umili. L'anno scorso, un ricercatore indipendente di intelligenza artificiale di nome Connor Leahy ha pubblicato il seguente messaggio su un server Discord: "Ehi ragazzi, lasciamo che [SIC] dia a OpenAI una corsa per i loro soldi come ai bei vecchi tempi."
Così si formò il gruppo. Ora ha centinaia di contributori che pubblicano il loro codice sul repository di software online GitHub.
Gli sforzi di IA open-sourcing non sono nuovi. In effetti, la piattaforma di gestione del flusso di lavoro Airflow di Airbnb e il motore di rilevamento dei dati di Lyft sono i risultati dell'utilizzo di strumenti open source per consentire ai data team di lavorare meglio con i dati, ha sottolineato Ali Rehman, project manager per la società di software CloudiTwins in un'intervista via email con Lifewire.
"Proprio come la rivoluzione dell'open source ha portato a una trasformazione dello sviluppo del software, allo stesso modo ha guidato lo sviluppo e la democratizzazione della scienza dei dati e dell'intelligenza artificiale", ha affermato Rehman. "L'open source è diventato un fattore fondamentale per le soluzioni di data science aziendale, con la maggior parte dei data scientist che utilizza strumenti open source."
Aprire la porta
Lo sviluppo dell'IA open source potrebbe contribuire a rendere il potere potenzialmente rivoluzionario della nuova tecnologia meno soggetto a pregiudizi ed errori, sostengono alcuni osservatori.
La ricerca sull'intelligenza artificiale ora avviene principalmente all'aperto, con quasi tutte le aziende, i laboratori di ricerca e le università che presentano immediatamente i loro risultati in pubblicazioni accademiche, ha detto a Lifewire Kush Varshney, un ricercatore di intelligenza artificiale presso IBM, in un'intervista via e-mail.
"Questa comunità aperta è essenziale, in quanto fornisce livelli avanzati di controllo e bilanciamento per garantire che l'IA venga ricercata, creata, implementata e applicata in modo responsabile", ha aggiunto Varshney. "Ciò è particolarmente critico nelle situazioni in cui questi sistemi possono influenzare la vita dei nostri membri più vulnerabili della società. Questa apertura si applica non solo all'apprendimento automatico generale e agli algoritmi di apprendimento profondo, ma anche agli elementi di un'IA affidabile."
Rehman ha affermato che una delle differenze critiche tra il software proprietario e quello open source è la flessibilità e la personalizzazione. La ricerca proprietaria sull'IA avrà problemi con la sicurezza, gli aggiornamenti e le ottimizzazioni.
"Questo perché l'approccio basato sulla comunità open source riceve preziosi input da migliaia di esperti del settore che identificano potenziali vulnerabilità della sicurezza che vengono poi risolte più rapidamente", ha aggiunto Rehman."Il consenso della comunità significa che la qualità è garantita e nuove opportunità sono più facilmente identificate."
Un altro problema è che la ricerca proprietaria sull'IA non sarà interoperabile, il che significa che non può funzionare con vari formati di dati e probabilmente avrà un blocco del fornitore, il che impedisce alle aziende di testare e provare il software prima di impegnarsi in una soluzione, Rehman ha detto.
Ma non tutti gli aspetti della ricerca sull'intelligenza artificiale devono essere open source, ha detto a Lifewire Chris Kent, il CEO della società di intelligenza artificiale medica Reveal Surgical in un'intervista via e-mail. "È importante proteggere gli incentivi economici che guidano lo sviluppo commerciale delle applicazioni chiave dell'IA", ha affermato.
Tuttavia, la ricerca sull'IA ha bisogno di un solido componente open source, ha affermato Kent. Ha aggiunto che l'open source lavora per creare fiducia e utilizzare set di dati che non sono o non dovrebbero essere controllati da singole istituzioni o aziende.
"Un approccio open source è il modo migliore per identificare e compensare i pregiudizi sottostanti che possono esistere nei set di formazione e porterà ad applicazioni più olistiche, creative e affidabili dell'IA", ha affermato Kent.