Ecco come funziona o1, il modello di OpenAi che “pensa” prima di rispondere
Svelato finalmente il progetto Straberry. Il nuovo modello di Ai è disponibile per gli utenti ChatGpt Plus e Team
3' di lettura
3' di lettura
OpenAI ha annunciato oggi o1, una nuova serie di modelli per risolvere problemi sempre più complicati: da compiti complessi alla migliore risoluzione di problematiche rispetto alle versioni precedenti della tecnologia. Questa rappresenta una early preview di questa serie che include o1-preview e o1-mini, su ChatGPT e nelle API.
«Abbiamo addestrato questi modelli a dedicare più tempo a riflettere sui problemi prima di rispondere, proprio come farebbe una persona. Attraverso l’addestramento, imparano ad affinare il loro processo di pensiero, a provare strategie diverse e a riconoscere i loro errori».
Noto con il nome in codice Strawberry come si legge nel blog o1-preview è un nuovo modello linguistico di grandi dimensioni. È stato addestrato con l’apprendimento per rinforzo per eseguire ragionamenti complessi. E come scrivono sul blog: «o1 pensa prima di rispondere: può produrre una lunga catena interna di pensieri prima di rispondere all’utente».
«In sostanza - si legge - attraverso il processo di training questi modelli imparano a rifinire il metodo di elaborazione attraverso l’utilizzo di varie possibilità e riconoscendo gli errori». Vuole dire che risponde a domande più avanzate e in modo più rapido, anche rispetto a un essere umano.
Similmente a come un essere umano può pensare a lungo prima di rispondere a una domanda difficile, o1 usa una catena di pensiero quando cerca di risolvere un problema. Attraverso l’apprendimento per rinforzo, o1 impara ad affinare la sua catena di pensiero e a perfezionare le strategie che usa. Impara a riconoscere e correggere i suoi errori. Impara a scomporre i passaggi difficili in passaggi più semplici. Impara a provare un approccio diverso quando quello attuale non funziona.




