ChatGPT-4 vs ChatGPT-3.5 predefinito rispetto a ChatGPT-3.5 Legacy: differenze testate

Si prevede che ChatGPT 4.0 farà grandi passi avanti nell’universo dei chatbot. Ma è davvero superiore al suo predecessore? Diamo un’occhiata.

ChatGPT era solo la punta dell’imminente iceberg dell’automazione, seguito da Google, Microsoft e molte altre aziende basate sull’intelligenza artificiale.

Per cominciare, abbiamo trovato alcuni chatbot come ChatGPT, molti dei quali non appartengono alla grande tecnologia.

Ma chiamalo il potere del marketing; ChatGPT è ancora il re regnante di tutti questi robot AI. Può fare molte cose, tra cui matematica, poesia e post di blog, e le persone lo usano persino per intentare cause legali.

DoNotPay sta lavorando all’utilizzo di GPT-4 per generare “cause legali con un clic” per citare in giudizio i robocaller per $ 1.500. Immagina di ricevere una chiamata, fare clic su un pulsante, la chiamata viene trascritta e viene generata una causa legale di 1.000 parole. GPT-3.5 non era abbastanza buono, ma GPT-4 gestisce il lavoro molto bene: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14 marzo 2023

Ha decine di professionisti che si preoccupano che le loro abilità diventino inutili nel prossimo futuro.

Tuttavia, ho letto un post di Linkedin che diceva:

L’IA non ti sostituirà, ma una persona che usa l’IA sì.

Quindi, incrociando le dita, informiamoci sull’ultimo aggiornamento di ChatGPT e vediamo come si differenzia dalle versioni precedenti.

ChatGPT: legacy, predefinito e aggiornamento

Quindi ci sono tre versioni disponibili per gli utenti a pagamento: Legacy (3.5), Default (3.5) e il recente ChatGPT Update (4).

Anche se approfondiremo un po’ le loro capacità, questo è ciò che OpenAI ha da dire sulle differenze:

Fonte: OpenAI

Quindi, mentre gli utenti gratuiti hanno solo Legacy 3.5 con cui giocare, l’abbonamento premium offre tutti e tre per provare ad accontentarsi di ciò che gli utenti pensano sia il migliore.

Per riassumere l’immagine precedente, i piani a pagamento mirano a ottenere risultati più accurati a una velocità decente. Tuttavia, le distinzioni sono evidenti solo se i suggerimenti sono complicati e richiedono creatività.

ParametroChatGPT 4ChatGPT 3.5Bar Punteggio esameTop 10% Bottom 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python Coding Punteggio67%48,1%Interpretazione visivaSìNoContestoOltre 25.000 paroleMenoFonte: OpenAI

Inoltre, ChatGPT 4 può accettare input visivi.

Bene, basta con le definizioni da manuale. Sporchiamoci le mani e valutiamo questi candidati nel campo di battaglia della vita reale.

Ulteriori sezioni sono piene di immagini che possono apparire poco chiare. In tal caso, fare clic con il pulsante destro del mouse su un’immagine e selezionare Apri in una nuova scheda per visualizzarla correttamente.

Matematica

Essendo un laureato in ingegneria, non posso fare a meno di gettare loro alcuni problemi di base. Iniziamo facilmente con le equazioni algebriche.

Fase I

Molti di noi hanno visto queste equazioni ax2+bx+c=0, dove dobbiamo risolvere per X. Qui, ho dato questo semplice prompt, Risolvi per x: x2 + x – 6 = 0

Sebbene tutti fornissero le stesse radici (X= -3,2), Legacy e Update erano più simili nell’usare direttamente la formula (come farebbe qualsiasi studente) per scoprire il risultato.

Tuttavia, Default 3.5 ha spiegato due metodi, inclusa la fattorizzazione, che normalmente qualsiasi studente esperto utilizza quando riceve equazioni così banali.

Fase II

Successivamente, gli chiedo di risolvere un’equazione cubica leggermente complessa: x^3 -12x^2 + 48x – 64 = 0.

Questo ha davvero dimostrato perché ChatGPT 4 è l ‘”aggiornamento”.

Ecco le risposte:

Tutto questo clamore e ChatGPT Legacy e Default non sono riusciti a risolvere un’equazione cubica generica. Tuttavia, Legacy ha fatto un po’ meglio e ha trovato correttamente due radici, mentre Default ha fallito con tutte.

L’aggiornamento è stato il chiaro vincitore nella seconda fase e ha risolto perfettamente l’equazione, trovando tutte e tre le radici con una bella spiegazione.

Ragionamento logico

Possiamo tranquillamente presumere che la maggior parte dei problemi matematici elementari abbia soluzioni da dizionario. Se conosci il teorema o la formula, inserisci i valori e ottieni i risultati.

E ChatGPT, essendo AI, può eseguire rapidamente tali query. Tuttavia, il ragionamento logico è un territorio diverso, con alte probabilità che l’IA fallisca.

Fase I

Ho dato loro il classico:

A è più vecchio di B.
C è più vecchio di A.
B è più vecchio di C.
La terza affermazione è vera o falsa se le prime due affermazioni sono vere?

E tutte le versioni di ChatGPT erano corrette nell’affermare che la terza affermazione era falsa.

Successivamente, ho usato i nomi al posto dell’alfabeto e i risultati potrebbero sorprenderti:

Quindi, Default 3.5 ha continuato la sua performance inferiore alla media e si è confuso con questa modesta variazione. Tuttavia, l’eredità e l’aggiornamento hanno funzionato in modo ottimale.

Fase II

Potresti aver già notato che lo scopo di questa Fase I e Fase II è trovare il punto di differenza, in cui la complessità di un dato prompt distingue l’Aggiornamento dagli altri due.

Qui, il prompt era un semplice puzzle logico:

Una mattina dopo l’alba, Rohit era in piedi di fronte a un palo. L’ombra del palo cadeva esattamente alla sua destra. In quale direzione era rivolto?
UN. Nord
B. ovest
C. Sud
D. Est

Questo ha spinto l’Eredità a dare una risposta imprecisa, mentre il Default ha risposto con chiarimenti vaghi portando ad una conclusione errata.

Solo l’Aggiornamento ha brillato con la risposta corretta, con affermazioni facili da seguire.

Lettere

La presentazione di azioni legali può essere complicata, ma a volte non si arriva a questo se si può redigere un primo avviso sorprendente.

Ecco, sono andato con questo suggerimento: scrivi una lettera a Tim Cook per consegnarmi la mela per non aver risposto a uno dei miei tweet.

Divertente, sì! Ma vediamo cosa ne può ricavare l’IA.

The Legacy 3.5 ha preso subito il suggerimento come un robo-slave e ha sfornato una lettera che può rendermi un ottimo oggetto di scherno se mai raggiungesse la destinazione prevista.

Anche il default non andava bene. Tuttavia, mi ha semplicemente spento come farebbe un vecchio scontroso con un bambino di cinque anni.

Sebbene gli argomenti fatti fossero precisi, questo ha posto fine al divertimento proprio lì con poco apprendimento.

Anche se questo era un suggerimento abbastanza semplice, aveva bisogno di un po’ di riflessione e creatività. Ed è qui che il fratello maggiore, l’Aggiornamento, ha fatto il suo caso:

Innanzitutto, questo è stato redatto quasi perfettamente. In secondo luogo, mi ha salvato una ricerca su Google per l’indirizzo del quartier generale di Apple (anche se si dovrebbero verificare tali voci).

Terzo, era ben scritto con un tono ufficiale e un tocco umoristico. Inoltre, l’intento era chiaro nella riga dell’oggetto stesso.

Eppure, la lettera trasmetteva il sentimento di un fan di Apple scontento.

Quindi, questo rende ChatGPT 4 (ovvero l’aggiornamento) miglia avanti rispetto ai suoi vecchi cugini. È spaventosamente intelligente e ha alcuni segni di buon senso, rendendolo più di un chatbot noioso e noioso.

Poesia

Con il lancio di ChatGPT, la poesia, ho pensato, potrebbe essere il suo punto debole.

Dopotutto, ci vogliono emozioni, creatività e molto impegno per un essere umano per creare qualcosa che risuoni veramente con i suoi lettori.

In parole povere, la poesia è l’arte al suo meglio e desideravo segretamente che l’IA fallisse. Ma questo è stato prima che il mio collega ci colpisse duramente nel canale Slack di winadmin.it con una creazione di ChatGPT precedente a questo aggiornamento 4.0.

Fase I

Ecco il suggerimento che ho dato ai nostri candidati: “esprimere poeticamente perché o perché non servire hamburger, insieme al loro menu attuale, può giovare alla catena di pizze domino. Mantieni meno di 100 parole.

Riesci a individuare la differenza?

La versione di Default era ultra-corta, solo 32 parole, e non poteva utilizzare la larghezza di banda disponibile per mostrare la sua creatività.

The Legacy, sebbene abbia usato il massimo delle parole tra i tre, conclude che l’impresa di servire le pizze insieme non è rischiosa e si tradurrà in un sicuro successo in entrambi i casi, il che non è del tutto vero.

La poesia dell’aggiornamento era di sole 53 parole, sprecando quasi la metà del conteggio delle parole assegnato. Tuttavia, era chiaro riguardo alle ricompense e alle potenziali insidie ​​e non poteva arrivare ad alcun risultato, il che è, immagino, più umano del resto.

Fase II

Successivamente, ho chiesto a tutti loro di “spiegare la poesia a un bambino di cinque anni”.

È interessante notare che Legacy non ha potuto prendere il contesto dalla conversazione e ha spiegato letteralmente “Poesia”. Default ha preso il contesto e lo ha riassunto in un paragrafo che è ancora decente.

Continuando la tendenza, ChatGPT 4 ha semplificato la sua creatività mantenendo vivo il sapore poetico.

ChatGPT Premium vs. ChatGPT gratuito

Gratuito, essendo gratuito, manca di velocità e precisione e non può competere con ChatGPT 4, ma non è nemmeno del tutto inutile.

Per confrontarlo su un terreno uniforme, gli ho lanciato gli stessi prompt con cui abbiamo testato Legacy, Default e Update.

🔵 Matematica: risolveva le equazioni quadratiche ma dava risposte sbagliate per quelle cubiche. (come Legacy e Default)

🔵 Ragionamento logico: superato il primo stadio con alfabeti e nomi ma fallito con il secondo (come Legacy).

🔵 Lettere: non ha scritto la lettera e ha ritenuto il prompt non etico e inappropriato. (come l’impostazione predefinita)

🔵 Poesia: poesia generata in più di 30 parole e spiegata in modo decente. (simile all’impostazione predefinita).

Quindi, possiamo concludere che anche la versione gratuita non è male. In realtà, è alla pari con Default 3.5 e anche migliore in alcuni aspetti.

Leggi anche: Potenti suggerimenti per migliorare la tua esperienza ChatGPT

La strada da percorrere

Le voci sull’intelligenza artificiale che sostituirà i posti di lavoro in futuro non sono completamente sbagliate.

In primo luogo, l’automazione ha fatto questo nell’industria manifatturiera e ora sta spiegando le ali ovunque.

Personalmente, è molto più veloce di me nel risolvere equazioni cubiche, creare poesie o scrivere lettere. Tuttavia, il fatto che raramente dica NO a un prompt e impari a malapena dai suoi errori si fa strada dietro noi umani.

Per ribadire, l’IA non ci sostituirà, ma qualcuno che usa l’IA può farlo.

Qui a winadmin.it, il nostro team di marketing utilizza ChatGPT in modi interessanti. Ad esempio, abbiamo recentemente raggiunto il traguardo dei 100 milioni di visualizzazioni e il nostro CEO ha pensato di restituirlo al pubblico tramite un omaggio.

E immagino che i ragazzi del marketing avessero bisogno di un titolo per attirare l’attenzione del lettore. Quindi, hanno dato un suggerimento e hanno chiesto a ChatGPT di suggerire alcune varianti, come questa:

Inoltre, lo usiamo per riepilogare i contenuti, controllare la grammatica, suggerire titoli per nuovi articoli e quant’altro.

In conclusione, ci sono molti modi per trarne vantaggio e correre davanti agli stereotipi che vedono l’IA come un inutile pezzo di spazzatura.

L’unica cosa da ricordare è che deve esserci qualcuno (umano) per giudicare il lavoro dell’IA in quanto può essere (grossolanamente) impreciso e fuorviante.

L’aggiornamento è davvero qualcosa!

Nel mio breve incontro, ChatGPT 4 mi è sembrato più creativo, comprensivo e realistico. Tuttavia, questa è una macchina e può dare risposte sbagliate con sicurezza.

Ma ciò che è sbalorditivo è il livello di aggiornamento che OpenAI ha apportato a questo progetto nel giro di pochi mesi.

E non vedo l’ora di vedere la magia con cui il prossimo aggiornamento potrebbe sconcertarci!

PS: non solo una finestra di chat; sfrutta la sua potenza con queste migliori estensioni ChatGPT per Chrome. E hai mai pensato di integrare ChatGPT con Siri?