Ecco Italia, un modello di IA large language come Gpt, tutto italiano
L’ha presentato oggi, e pubblicato open source per un libero download, l’azienda italiana iGenius in collaborazione con Cineca
4' di lettura
4' di lettura
Ecco Italia, un modello di IA large language come Gpt, tutto italiano. L’ha presentato oggi, e pubblicato open source per un libero download, l’azienda italiana iGenius in collaborazione con Cineca (il più grande polo di computing italiano, un consorzio interuniversitario).
Anche se la versione è ancora 0.1, Italia si pone ad oggi come il maggiore e più compiuto large language model made in Italy, formato con la nostra lingua e pensato per lo sviluppo di aziende e pubbliche amministrazioni italiane.
L’anima italiana è insomma presente a più livelli, come spiegato nella presentazione odierna dall’azienda. È nel data base utilizzato, più del 90 per cento dati italiani, con il vantaggio di comprendere meglio la nostra lingua, le sue sfumature, e il nostro contesto storico-culturale. Ne viene anche con un guadagno di efficienza del 60 per cento, perché gli attuali modelli, basati sull’inglese, quando devono gestire altre lingue fanno un continuo lavoro di traduzione invisibile all’utente.
L’italianità è anche nello spirito del prodotto: obiettivo, dichiarato oggi, è aiutare l’Italia a essere attrice di questa rivoluzione e non semplice consumatrice di prodotti stranieri. Ecco perché Italia è open source, per essere elemento abilitante di sviluppo del Paese, delle nostre imprese e PA; senza più dipendenze da prodotti stranieri.
Gli elementi distintivi di Italia
Da un punto di vista tecnico, Italia ha 9 miliardi di parametri, una finestra di contesto di 4.096 token e un vocabolario di 50.000 token. Ha usato per il training migliaia di miliardi di token, utilizzando un mix eterogeneo di fonti: sorgenti pubbliche, dati sintetici e contenuti di settore forniti dai partner commerciali di iGenius.





