La saga OpenAI

Intelligenza artificiale

Ecco come funziona o1, il modello di OpenAi che “pensa” prima di rispondere

Svelato finalmente il progetto Straberry. Il nuovo modello di Ai è disponibile per gli utenti ChatGpt Plus e Team

12 settembre 2024

3' di lettura

OpenAI ha annunciato oggi o1, una nuova serie di modelli per risolvere problemi sempre più complicati: da compiti complessi alla migliore risoluzione di problematiche rispetto alle versioni precedenti della tecnologia. Questa rappresenta una early preview di questa serie che include o1-preview e o1-mini, su ChatGPT e nelle API.

here is o1, a series of our most capable and aligned models yet:https://t.co/yzZGNN8HvD

o1 is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it. pic.twitter.com/Qs1HoSDOz1
— Sam Altman (@sama) September 12, 2024

«Abbiamo addestrato questi modelli a dedicare più tempo a riflettere sui problemi prima di rispondere, proprio come farebbe una persona. Attraverso l’addestramento, imparano ad affinare il loro processo di pensiero, a provare strategie diverse e a riconoscere i loro errori».

Noto con il nome in codice Strawberry come si legge nel blog o1-preview è un nuovo modello linguistico di grandi dimensioni. È stato addestrato con l’apprendimento per rinforzo per eseguire ragionamenti complessi. E come scrivono sul blog: «o1 pensa prima di rispondere: può produrre una lunga catena interna di pensieri prima di rispondere all’utente».

«In sostanza - si legge - attraverso il processo di training questi modelli imparano a rifinire il metodo di elaborazione attraverso l’utilizzo di varie possibilità e riconoscendo gli errori». Vuole dire che risponde a domande più avanzate e in modo più rapido, anche rispetto a un essere umano.

Similmente a come un essere umano può pensare a lungo prima di rispondere a una domanda difficile, o1 usa una catena di pensiero quando cerca di risolvere un problema. Attraverso l’apprendimento per rinforzo, o1 impara ad affinare la sua catena di pensiero e a perfezionare le strategie che usa. Impara a riconoscere e correggere i suoi errori. Impara a scomporre i passaggi difficili in passaggi più semplici. Impara a provare un approccio diverso quando quello attuale non funziona.

i love summer in the garden pic.twitter.com/Ter5Z5nFMc
— Sam Altman (@sama) August 7, 2024

Come ha di diverso rispetto al passato?

In pratica, nasce per scrivere meglio codice e risolvere problemi multi-step rispetto ai modelli precedenti. E’ un sistema sperimentale, con una vocazione alla matematica ed è anche più costoso e più lento da usare rispetto a GPT-4o. «In molti benchmark basati sul ragionamento, o1 rivaleggia con le prestazioni degli esperti umani». Le attese di OpenAi sono quindi di avere un modello in gradi di essere più “bravo” in matematica e meno soggetto alle allucinanzioni (agli errori).

«Nei nostri test - scrivono sul blog - questi modelli si comportano come gli studenti dei dottorati alle prese con complesse questioni di fisica, chimica e biologia. Inoltre, abbiamo scoperto che i nuovi modelli riscontrano buoni risultati in ambito matematico e di coding».

Il modello ammetto lo stesso Sam Altman rimane limitat. Sono assenti anche rilevanti feature nelle Api, Per molti casi più comuni, per ora GPT-4o rimane più funzionale.

Chi lo può già usare?

All’interno di ChatGPT, gli utenti Plus e Team possono accedere fin da ora alla early preview di uno dei nuovi modelli selezionando “o1-preview” dalle opzioni di modelli disponibili. È stato rilasciato anche “OpenAI o1 mini”, un modello ancora più veloce progettato per indirizzare le domande STEM. Entrambi i modelli sono disponibili a partire da oggi. Gli utenti di ChatGPT Enterprise ed Edu avranno accesso ad entrambi i modelli a partire dalla prossima settimana.

E c’è anche OpenAI o1-mini

Si tratta di un modello di ragionamento più veloce ed economico che è particolarmente efficace nella codifica. Come modello più piccolo, o1-mini è l’80% più economico di o1-preview, il che lo rende un modello potente ed economico per le applicazioni che richiedono ragionamento ma non una vasta conoscenza del mondo.

Luca TremoladaGiornalista
- @lucatremolada
- LinkedIn
Luogo: Milano via Monte Rosa 91
Lingue parlate: Inglese, Francese
Argomenti: Tecnologia, scienza, finanza, startup, dati
Premi: Premio Gabriele Lanfredini sull’informazione; Premio giornalistico State Street, categoria "Innovation"; DStars 2019, categoria journalism
Scheda autore
Trust project