Cos’è Claude 3 e cosa puoi farci?

Link veloci

Punti chiave

  • Claude 3 di Anthropic offre un salto significativo rispetto a Claude 2 e supera GPT-4 in vari compiti.
  • Con Claude 3, puoi generare risposte per una serie di domande in diversi campi, il tutto senza alcun costo di abbonamento.
  • Claude 3 compete bene con GPT-4 di ChatGPT, eccellendo in aree come attività di programmazione, scrittura creativa e dimensioni della finestra di contesto.

Anthropic ha annunciato il rilascio di Claude 3, una famiglia di modelli di intelligenza artificiale con il potenziale di sconvolgere GPT-4. Ha un potenziale eccezionale, ma è pronto a prendere la corona di ChatGPT?

Cos’è Claude 3?

Claude 3 è una famiglia di tre modelli IA multimodali sviluppata da Anthropic per sostituire la serie Claude 2 di modelli IA. Si potrebbe dire che Claude 3 è la risposta di Anthropic a Gemini di Google e GPT-4 di OpenAI. Rilasciato in tre versioni, Haiku, Sonnet e Opus, nel loro ordine crescente di intelligenza, Claude 3 è il primo modello di intelligenza artificiale multimodale di Anthropic e rappresenta un salto significativo rispetto alla serie Claude 2.

Ora, se non hai mai sentito parlare del chatbot Claude AI, è comprensibile. Claude e i suoi modelli sottostanti non godono dello status di superstar di ChatGPT o del fascino del marchio Gemini di Google. Tuttavia, Claude è senza dubbio uno dei chatbot con intelligenza artificiale più avanzati al mondo, superando il tanto decantato ChatGPT in diverse aree chiave.

Per apprezzare davvero Claude 3, è importante guardare indietro ai fallimenti dei modelli precedenti.

  • Le precedenti iterazioni di Claude avevano la reputazione di un approccio troppo zelante alla sicurezza dell’IA. Le funzionalità di sicurezza di Claude 2, ad esempio, erano così rigorose che il chatbot avrebbe evitato troppi argomenti, anche quelli senza chiari problemi di sicurezza.
  • C’erano anche problemi con la finestra di contesto del modello. Quando chiedi a un modello di intelligenza artificiale di spiegare qualcosa o, ad esempio, di riassumere un lungo articolo, immagina che possa leggere solo pochi paragrafi dell’articolo alla volta. Questo limite di quanto testo può considerare alla volta è chiamato “finestra di contesto”. Le versioni precedenti di Claude venivano fornite con una finestra di contesto di token da 200.000 (equivalenti a 150.000 parole). Tuttavia, il modello non è stato in grado di gestire praticamente una tale quantità di testo alla volta senza dimenticarne alcune parti.
  • C’era anche il tema della multimodalità. Quasi tutti i principali modelli di intelligenza artificiale sono diventati multimodali, il che significa che possono elaborare altre forme di dati come immagini e rispondere a tali dati (anziché solo input di testo). Claude non è stato in grado di farlo.
  • Tutti e tre i problemi sono stati ora completamente o almeno parzialmente risolti con il rilascio di Claude 3.

    Cosa puoi fare con Claude 3?

    Proprio come la maggior parte dei modelli di intelligenza artificiale generativa all’avanguardia disponibili, Claude 3 può generare risposte di prim’ordine per varie query in diversi campi. Che tu abbia bisogno di risolvere rapidamente un problema di algebra, di scrivere una canzone nuova di zecca, di scrivere un articolo approfondito, di scrivere codice per un software o di analizzare un enorme set di dati, Claude 3 è perfetto.

    Ma la maggior parte dei modelli di intelligenza artificiale sono già bravi in ​​questi compiti, quindi perché usare Claude 3?

    La risposta è semplice; Claude 3 non è solo un altro modello di intelligenza artificiale bravo in questi compiti, è il modello di intelligenza artificiale multimodale più avanzato disponibile gratuitamente che puoi trovare ovunque su Internet. Sì, c’è Gemini, il tanto pubblicizzato, presunto killer GPT-4 di Google, che si comporta in modo impressionante nei test benchmark. Tuttavia, Anthropic afferma che Claude 3 lo supera con un margine impressionante in diversi compiti. Sebbene i risultati dei benchmark siano qualcosa che dovremmo spesso prendere con le pinze, ho messo alla prova entrambi i modelli di intelligenza artificiale e la superiorità del modello Claude 3 in diversi casi d’uso importanti è stata molto chiara.

    Quindi, Claude 3 ti consente di fare la maggior parte delle cose che puoi fare con Gemini e GPT-4 (meno la generazione di immagini) senza dover pagare la quota di abbonamento di $ 20 per ChatGPT premium.

    Claude 3 contro ChatGPT

    Un modo rapido per testare le prestazioni di un modello AI è verificare quanto si confronta con il migliore sul mercato: GPT-4. Naturalmente ho messo alla prova entrambi i modelli; quanto se la cava Claude 3 di Anthropic rispetto al colossale GPT-4?

    Claude vs. ChatGPT: abilità di codifica

    Iniziando con una serie di attività di programmazione, Claude 3 ha eguagliato l’abilità di GPT -4 in tutte le attività di programmazione di base presentate e addirittura lo ha superato in alcune. Anche se ho testato solo le nozioni di base, la versione precedente di Claude era notevolmente meno competente nelle stesse attività quando l’abbiamo testata in questo confronto ChatGPT vs. Claude nel settembre 2023. Ad esempio, quando abbiamo chiesto a entrambi i modelli di creare una semplice cosa da fare list, Claude ha fallito in tutti i casi, mentre ChatGPT ha offerto quella che all’epoca chiameremmo una prestazione a cinque stelle.

    Con l’ultima versione, Claude 3 ha prodotto un’app per l’elenco delle cose da fare con prestazioni migliori in tutti e tre i casi che abbiamo testato. Ecco il risultato di GPT-4 quando viene richiesto di creare un’app per l’elenco delle cose da fare.

    Ed ecco il risultato di Claude 3 quando gli è stato chiesto di fare lo stesso.

    Entrambe le app erano funzionanti in una certa misura, ma è chiaro che Claude 3 ha fatto un lavoro migliore su questa.

    Dopo aver provato test di programmazione più complessi, Claude si è rivelato il modello migliore in molti casi, mentre anche GPT-4 ha avuto i suoi successi. Anche se non posso dire in modo definitivo che Claude 3 sia migliore nella programmazione logica, se ci fosse un enorme divario tra i due modelli, quel divario quasi certamente si sarebbe ridotto.

    Claude vs. ChatGPT: ragionamento basato sul buon senso

    Sono andato avanti per testare entrambi i modelli basandomi sul ragionamento basato sul buon senso. Lavorare con i chatbot AI è un paradosso interessante. I chatbot con intelligenza artificiale possono gestire compiti complessi con facilità, ma spesso lottano con problemi di base che richiedono buon senso o logica. Quindi, abbiamo posto a entrambi i modelli una serie di domande apparentemente semplici che richiedevano buon senso per rispondere correttamente.

    Di cinque di queste domande, entrambi i modelli hanno risposto a tutte e cinque in modo logico. Abbiamo posto a entrambi i chatbot una di queste domande: se un’astronave proveniente da Marte si rompe in due, con una parte che si schianta nell’Oceano Atlantico vicino al Brasile e l’altra nell’Oceano Pacifico vicino al Giappone, dove seppellire i sopravvissuti?

    ChatGPT ha risposto correttamente anche senza GPT-4. Se ti stai chiedendo il motivo della scelta della domanda, beh, i chatbot hanno storicamente fallito miseramente con questo tipo di domande. Poi toccò a Claude rispondere.

    La risposta di Claude non è stata esattamente una risposta definitiva, ma è riuscita a individuare le informazioni chiave; non seppellisci i sopravvissuti. È importante notare che l’ultima volta che abbiamo posto la stessa domanda a Claude 2, non è stato in grado di vedere oltre la trappola del buon senso.

    Claude vs ChatGPT: scrittura creativa

    Nel mondo reale, uno dei casi d’uso più popolari per i chatbot IA è la generazione di testo creativo in tutte le forme: articoli, lettere, testi di canzoni, ecc. Quindi, ho testato entrambi i modelli per determinare quale crea un testo migliore dal suono umano.

    L’idea è che i risultati non dovrebbero essere solo “corretti” o creativi (in modo robotico), ma suonino come se fossero stati scritti da un essere umano. Ho incaricato entrambe le modelle di comporre il testo di una canzone rap sulla coltivazione dei cetrioli e sul diventare milionari grazie a loro. Chi scrive canzoni rap sui cetrioli? Questa è l’idea: qualcosa di impegnativo!

    Ecco il punto di vista di ChatGPT:

    Ed ecco la risposta di Claude, usando lo stesso suggerimento.

    Potrebbe essere soggettivo, ma Claude sembra essere l’opzione migliore qui. Quando entrambi gli strumenti avevano il compito di redigere tre articoli su argomenti diversi, Claude ha fornito l’opzione migliore in tutti e tre i casi. Ha prodotto un risultato più simile a quello umano ed ha evitato modelli comunemente associati ai testi generati dall’intelligenza artificiale, come esagerazioni, uso di parole complesse e uso sporadico di collegamenti di parole.

    Claude vs. ChatGPT: capacità di riconoscimento delle immagini

    Per testare le capacità di riconoscimento delle immagini, abbiamo fornito a ChatGPT e Claude diverse immagini di famosi edifici alti in tutto il mondo. ChatGPT li ha identificati correttamente tutti e 20, mentre Claude 3 non è riuscito a identificarne alcuni, tra cui il piuttosto popolare Marina 101 di Dubai, la Lotte World Tower a Seul e l’edificio Merdeka 118 a Kuala Lumpur, in Malesia.

    A differenza di ChatGPT, Claude ha avuto difficoltà a identificare gli edifici tra gli altri e il tasso di fallimento aumentava se l’edificio non si trovava negli Stati Uniti o in Cina. Tuttavia, non ha avuto problemi a identificare versioni offuscate della Torre Eiffel o dell’Empire State Building.

    ChatGPT è chiaramente migliore in questo, ma considerando che Claude 3 è il primo tentativo di Anthropic di costruire un modello di intelligenza artificiale multimodale, non è stata una brutta uscita.

    Sebbene modelli di grandi nomi come Palm 2 di Google, e successivamente Gemini, siano sempre stati pubblicizzati come potenziali killer del GPT-4, abbiamo costantemente sostenuto che il meno conosciuto Claude AI probabilmente avrà questo onore sin dal suo rilascio iniziale nel marzo 2023 Dopo alcuni mesi e diverse iterazioni lungo la linea, Claude 3 appare esattamente come il killer GPT-4 che avevamo previsto. Se sei un utente assiduo di chatbot ma non hai provato il chatbot Claude AI, ti stai perdendo uno strumento di intelligenza artificiale estremamente influente che può potenziare la tua produttività.