Il nuovo ChatGPT o1 è qui, ma la maggior parte di noi è troppo stupida per usarlo

September 13, 2024 admin

OpenAI ha annunciato ApriAI o1nome in codice “Fragola“, una nuova serie di LLM (modello linguistico di grandi dimensioni) che sono in grado di “ragionare” e quindi di risolvere problemi molto complessi.

Attenzione a prendere questa definizione con le molle!

Quando si ha a che fare con l'intelligenza artificiale è sempre facile cadere nel tranello di pensare che questi sistemi “capiscano” e “ragionino”, ma non è così. Si tratta comunque di modelli matematici probabilistici, e approcciarsi a loro come fossero senzienti e capaci di formulare un'opinione è sbagliata.

Detto questo, vediamo come Strawberry differisce dalle versioni precedenticosa è in grado di fare, e anche quali sono i suoi limiti.

OpenAI o1: potenzialità e limiti

Al momento OpenAI o1 è in anteprima anticipatae integrato in ChatGPT (e nelle API dell'azienda) sotto forma di o1-anteprima e o1-minidue modelli che, proprio come GPT-4o e Mini GPT-4osi distinguono per la rapidità e la complessità delle loro risposte.

I punti di forza di Strawberry

Questi modelli sono stati addestrati in modo da impiegare più tempo a elaborare il problema prima di formulare una risposta, proprio come farebbe una persona. Così facendo il GPT prova approcci diversi, quindi dovrebbe fornire risposte migliori e possibilmente evitare errori.

Sì, OpenAI o1 è più lento di GPT-4o.

Secondo me test condotto da OpenAIquesti modelli possono superare uomini competenti, con dottorati di ricerca, nella risoluzione di complesse domande di fisica, chimica e biologia. Inoltre, sono migliorate le prestazioni anche in ambito matematico e di codifica.

C'è un ultimo aspetto sul quale OpenAI ha insistito, pur senza entrare nel dettaglio: la sicurezza.”Il processo di apprendimento di questi modelli rende più efficace l'allineamento agli standard di sicurezza e alle linee guida previste.“

Può sembrare un dettaglio, ma considerando le sempre maggiori capacità di questi modelli non lo è affatto.

Anzi, quello della sicurezza in materia di AI è uno dei nodi cruciali con i quali dovremo inevitabilmente scontrarci, via via che questi sistemi diventeranno sempre più di dominio pubblico.

E i suoi limiti

Al netto della minore velocità, che può essere visto come un maschio necessario in vista del migliore risultato, i modelli OpenAI o1 hanno diversi altri limiti.

Non supporta il caricamento di alcun tipo di file, l'opzione non è proprio disponibile a prescindere
Non è possibile navigare sul web alla ricerca di informazioni
Nell'API ci sono varie mancanze, come il supporto all'utilizzo di strumenti, la funzione di chiamata, lo streaming e la personalizzazione dei messaggi.
Non necessariamente i modelli precedenti in ambiti come la scrittura creativa o stilistica, data, biografie e curiosità.
Continua a commettere errori e può generare informazioni inesatte o allucinazioni.
È più suscettibile al contesto di prima. Quest'ultimo punto lo abbiamo aggiunto noi in seguito alle prove che abbiamo fatto. Il senso è che o1-preview tende a comportarsi meglio se il dialogo prosegue in modo lineare e logico. Se saltate di palo in frasca, lui cercherà prima di capire se c'è un collegamento con quanto detto prima, e questo porterà via tempo.
OpenAI dovrebbe imparare a dare nomi migliori ai suoi modelli. Magari potrebbe chiedere il loro consiglio.

Detta altrimenti, GPT-4o rimane il modello preferibile per gli usi più generalie laddove c'è necessità di elaborare file o di navigare su internet.

Ci aspettiamo che queste funzioni arrivino su OpenAI o1 con il passare del tempo.

Esempi pratici

In uno prova praticaè stato chiesto a o1-preview di sviluppare un simulatore didattico agenti utilizzando multipli e IA generativa, ispirandosi a un articolo fornito e considerando le prospettive di insegnanti e studenti. Il modello ha prodotto dettagliate linee di codice e un approccio strutturato, dimostrando una notevole capacità di tradurre istruzioni complesse in soluzioni operative.

Questa è forse la più grande differenza pratica rispetto ai suoi predecessori: o1-preview è più autonomo.

Tutta quella parte di correzione e affinamento che prima sarebbe stata il frutto di (numerose) interazioni con l'operatore umano, adesso viene fatta automaticamente (per la maggior parte).

Un altro test ha coinvolto la risoluzione di un cruciverba molto difficile. Mentre i modelli tradizionali di IA, come Claude, hanno fallito nel risolverlo a causa della mancanza di capacità iterativa, o1-preview ha impiegato oltre 100 secondi per “pensare” al problema.

Ha mostrato un processo di ragionamento iterativogenerando e scartando idee fino a raggiungere una soluzione quasi corretta. Anche se inizialmente è stato ingannato da un indizio ambiguo (riferito agli smartphone Samsung Galaxy), con un piccolo suggerimento è riuscito a correggersi e completare il cruciverba (anche se poi ha generato un'allucinazione).

Disponibilità

All'interno di ChatGPT, gli utenti Più e Squadra possono accedere fin da ora alla early anteprima di o1-preview e o1-mini.

Gli utenti di ChatGPT Impresa ed Educazione avranno accesso a entrambi i modelli a partire dalla prossima settimana.

I modelli OpenAI o1 saranno disponibili per gli sviluppatorima solo per il “Tier 5” al momento.

Non ci sono novità per la versione gratuita di ChatGPT, che al momento rimane limitata a GPT-4o e precedenti. L'accesso ai nuovi modelli è riservato agli abbonati, per ora.

Bonus per gli utenti Mac

Oltre a quanto abbiamo appena visto, c'è una bella novità per l'app di ChatGPT per macOS.

È arrivata la chat vocale!

È ora possibile dialogare con ChatGPT con la propria voce, senza nemmeno dover guardare lo schermo. In pratica il chatbot è diventato una sorta di assistente vocalein stile Siri, per quanto il tipo di risposte che possono fornire sempre limitate dal modello in uso. Chiariamo inoltre che, al contrario di Siri, ChatGPT non può interagire con macOS in alcun modo.

Le chat vocali vengono poi trascritte come ordinarie conversazioni con ChatGPT, e le ritroverete salvate assieme a tutte le altre nella storia. I messaggi audio, invece, non vengono salvati.

Per migliori risultati, è consigliabile impostare manualmente la lingua su italiano. Nelle nostre prove abbiamo in effetti avuto qualche problema in più con il rilevamento automatico.

Usiamo al meglio ChatGPT

Che si tratti del nuovo modello o di quelli precedenti, ChatGPT è in apparenza semplice da usare, ma richiede in realtà molta attenzione e anche tanto studio.

Per chi desidera approfondire la sua conoscenza, ci sono tante utili guide che abbiamo già reallizato al riguardo.

Source link