Guida completa per rilevare il plagio di chatbot AI

I chatbot AI come ChatGPT non si limitano a rispondere alle tue domande. Possono scrivere e-mail simili a quelle umane, lettere di presentazione, saggi, poesie, post di blog e molto altro.

La scrittura AI è come un camaleonte: può fondersi con qualsiasi altro tipo di scrittura così bene che sarebbe difficile capire la differenza.

Sfortunatamente, questo rende incredibilmente difficile per noi umani rilevare quando un’intelligenza artificiale ha scritto qualcosa invece di una persona. Certo, potremmo tutti seguire il consiglio di Sherlock Holmes ed “eliminare l’impossibile”, ma chi ha tempo per farlo?

E se ti dicessi che il paragrafo precedente è stato scritto da un’intelligenza artificiale? Sì, ho chiesto a YouWrite di scrivere una breve introduzione per questo post, che è quello che ne è venuto fuori. Abbastanza convincente vero? Questo è il problema, è troppo convincente che chiunque possa presentarlo come proprio lavoro per trarne vantaggio.

Le IA non si limitano a riformulare il contenuto; imparano l’argomento e lo presentano in un linguaggio naturale usando RLHF. Ciò significa che il contenuto generato non sembrerà né robotico da leggere né potrà essere confrontato con i dati disponibili online per rilevare il plagio.

Catturare i contenuti generati dall’intelligenza artificiale non è facile e non ho intenzione di darti false speranze che tu possa catturarli con una precisione del 100%. Tuttavia, con un po’ di lavoro investigativo e un po’ di aiuto dagli strumenti di rilevamento della scrittura di AI, puoi catturare la maggior parte delle opere di AI.

Di seguito troverai modi manuali per rilevare il plagio dell’IA e anche alcuni strumenti automatici.

Rileva manualmente il plagio AI 🕵️

ChatGPT non è nemmeno un grosso problema quando si tratta di plagio AI. Esistono molti strumenti alternativi basati sulla stessa tecnologia GPT-3 e progettati per la scrittura. Questi sono molto avanzati e realizzati appositamente per creare contenuti simili a quelli umani difficili da catturare.

Gli strumenti di rilevamento automatico sono un po ‘incostante a seconda del tipo, della lunghezza e della complessità del contenuto. Quindi, almeno attualmente, collegare manualmente i punti per capire se la scrittura è generata dall’intelligenza artificiale o meno è il modo migliore.

Di seguito ho elencato alcuni indizi comuni che potresti cercare per catturare i contenuti generati dall’intelligenza artificiale.

#1. Informazioni obsolete

ChatGPT e altre IA basate su GPT-3 hanno visto le loro conoscenze tagliate alla fine del 2021. Anche se alcuni robot IA hanno un motore di ricerca integrato per cercare le informazioni più recenti, si affidano ancora a vecchi dati per scrivere contenuti di lunga durata come saggi o post di blog.

Se noti che l’articolo parla costantemente di dati obsoleti, in particolare prima del 2021, allora potrebbe essere generato dall’IA.

Nello screenshot qui sotto, ho chiesto a YouWrite di parlarmi della recente Coppa del Mondo FIFA, e questo è ciò che è venuto fuori.

Si parla del Mondiale 2018 invece di quello recente del 2022. Anche se lo strumento viene aggiornato per parlare di eventi recenti come la Coppa del Mondo 2022, per scrivere post lunghi utilizza ancora i dati obsoleti su cui è costruito.

#2. Utilizza la stessa struttura della frase per le descrizioni

Durante la scrittura delle descrizioni di più prodotti/app, l’intelligenza artificiale di solito utilizza la stessa struttura della frase che modifica per adattarla alla descrizione di un prodotto. Le descrizioni di solito iniziano con la stessa parola, come The, It, A o il nome del prodotto. Le descrizioni hanno anche un focus dedicato che ripete.

Ad esempio, di seguito, ho chiesto a ChatGPT di parlarmi di “siti web di lavori di inserimento dati”. Puoi vedere tutte le descrizioni che iniziano con “A” e hanno un focus rigoroso.

Ho anche posto a YouChat la stessa domanda, e ha fatto la stessa cosa e ha ripetuto il nome di ciascun sito Web all’inizio, e le descrizioni stesse sembrano una versione riformulata di ciascuno.

Se il resoconto che stai analizzando ha una descrizione di qualcosa di simile in natura, è un ottimo modo per cogliere la scrittura AI.

#3. Utilizza frasi brevi

Per la maggior parte dei commenti, AI utilizzerà frasi di una riga con al massimo una singola virgola. Forse cercano di ridurre al minimo la possibilità di errore, ma evitano di scrivere frasi lunghe che potrebbero richiedere l’uso di due punti, punti e virgola o linee orizzontali pesanti.

So che questo non è l’indizio migliore per catturare la scrittura di AI, ma vale la pena considerare per dimostrare ulteriormente i tuoi sospetti.

#4. Può fornire informazioni errate

Per domande complesse che di solito comportano un qualche tipo di istruzione, l’IA può non comprendere l’intenzione e fornire informazioni errate. Non sto parlando di informazioni obsolete qui, ti dicono solo con sicurezza le informazioni sbagliate quando non afferrano l’argomento.

Ad esempio, ho chiesto a YouWrite di dirmi “come eseguire il root di un telefono Android senza PC”. Mi ha ancora mostrato metodi che implicano l’uso di un PC a un certo punto dell’istruzione.

#5. Non aggiunge un parere personale

Quando si parla di qualcosa, l’IA parla solo di fatti noti. A differenza degli umani, non parlerà della sua esperienza personale con esso. Sebbene gli IA possano essere istruiti a creare un resoconto pratico, tendono ad evitare di farlo per impostazione predefinita.

Se noti che l’articolo parla solo di fatti ben noti, è probabile che sia stato scritto da un’intelligenza artificiale. Ad esempio, parlando di un’app, parlerà delle sue funzionalità anziché di quanto sia fluida la navigazione o di come utilizzare effettivamente l’app.

#6. Brevi Spiegazioni

Poiché le IA sono limitate dalle conoscenze attualmente disponibili, tendono a scrivere brevi spiegazioni e descrizioni. Nella mia esperienza, se parlano di un argomento particolare, come il rooting di Android, mantengono la spiegazione entro 2-3 paragrafi al massimo. E per cose come app o prodotti, la descrizione di solito non supera 1 paragrafo.

Gli esseri umani possono scrivere in modo approfondito su qualcosa, comprese caratteristiche, limitazioni, esperienza personale, prezzi, ecc. D’altra parte, l’intelligenza artificiale di solito si concentra sulle caratteristiche principali o sui punti salienti, quindi anche il resoconto è breve. Se l’istruttore chiede maggiori dettagli, la possibilità di informazioni errate aumenta notevolmente.

#7. Controlla la storia dello scrittore

In qualità di insegnante o webmaster, se hai accesso al lavoro o ai compiti precedenti dell’autore, potrebbe essere una buona idea confrontarlo con l’articolo di cui sospetti. È altamente improbabile che lo scrittore abbia uno stile di scrittura simile a un’intelligenza artificiale. Anche se l’intelligenza artificiale può cambiare i toni di scrittura, gli stili che sceglie sono piuttosto generici e non possono copiare il tuo tono.

Prendendo l’esempio del paragrafo generato dall’intelligenza artificiale nell’introduzione di questo post. Chiunque abbia letto i miei post precedenti può facilmente vedere che il mio stile di scrittura è completamente diverso rispetto ad esso.

Puoi semplicemente leggere 2-3 lavori precedenti dello scrittore e vedere se corrisponde allo stile di scrittura del commento sospetto.

Strumenti per rilevare il plagio AI

Sono disponibili numerosi strumenti in grado di rilevare i contenuti scritti dall’intelligenza artificiale. Tuttavia, la loro accuratezza è diversa l’una dall’altra e può fallire a seconda del tipo di contenuto e della lunghezza.

Ho testato questi strumenti utilizzando diversi tipi di contenuti generati da ChatGPT, GPT-3 Playground, WriteSonic, Rytr e YouWrite. Sono riusciti a rilevare tutti i tipi di contenuti generati da ChatGPT e GPT-3 Playground.

Sebbene abbiano avuto risultati contrastanti per strumenti di scrittura dedicati, è interessante notare che tutti non sono riusciti a rilevare YouWrite, immagino sia perché YouWrite commette errori simili a quelli umani allo scopo di evitare il rilevamento.

Ti consiglierò di utilizzare questi strumenti insieme al controllo manuale del contenuto. Innanzitutto, analizza il contenuto con uno di questi strumenti, quindi controlla manualmente eventuali indizi per confermare ulteriormente il sospetto.

Di seguito elenco quelli che hanno offerto i migliori risultati e sono i più facili da usare:

Nota: per dimostrazione, utilizzerò il testo generato da WriteSonic su “Benefici dei manghi”.

#1. Contenuto in scala

Ho trovato il rilevatore di contenuto AI di Content At Scale il più accurato per la maggior parte dei test che ho eseguito. Ti consente di scansionare fino a 2500 caratteri per scansione e fa una previsione percentuale che mostra la densità del contenuto reale o falso.

È lecito ritenere che i contenuti falsi per oltre il 60% siano scritti da contenuti AI, almeno la maggior parte. Nello screenshot qui sotto, puoi vedere che il 96% dei contenuti è falso, che ho generato completamente con l’intelligenza artificiale.

#2. GPTZero

Se vuoi vedere esattamente quale contenuto è generato dall’IA, allora GPTZero è una buona opzione. GPTZero non valuta i contenuti. Invece, evidenzia il contenuto esatto che è probabilmente generato dall’IA.

Sebbene mostri punteggi di perplessità e raffica per avere un’idea della casualità nel testo, cosa più importante, supporta 5000 caratteri per scansione e può anche caricare file. La scansione di contenuti di grandi dimensioni aiuta notevolmente a migliorare la precisione.

#3. Rilevatore di uscita GPT-2

I creatori di ChatGPT offrono anche un bot per rilevare il proprio lavoro. Poiché GPT-2 e GPT-3 sono diversi solo nei dati totali utilizzati per l’addestramento, questo rilevatore GPT-2 funziona bene anche per le IA basate su GPT-3.

Non c’è limite alla quantità di contenuti che può scansionare, quindi è perfetto per rilevare contenuti generati dall’IA molto lunghi. Ho anche trovato soddisfacente la sua accuratezza, specialmente per i contenuti generati da ChatGPT. Tuttavia, è un po’ perdente nelle previsioni, quindi considera i suoi risultati solo quando mostra oltre il 50% del contenuto come falso.

#4. Rilevatore di contenuto AI di Writer

I risultati di Writer AI Content Detector sono discutibili quando si rilevano contenuti dagli strumenti di scrittura AI, ma funziona benissimo per i contenuti generati da ChatGPT. Puoi eseguire la scansione di 1500 caratteri per scansione e persino aggiungere l’URL del contenuto se è già stato pubblicato.

Per il mio test di testo generato dall’intelligenza artificiale, ha affermato che il 94% del contenuto è generato dall’uomo, il che è piuttosto sbagliato rispetto ad altri strumenti. Tuttavia, vale comunque la pena utilizzarlo per rilevare il contenuto di ChatGPT, soprattutto se è già stato pubblicato.

#5. Bozza e obiettivo

Uno strumento di rilevamento della scrittura AI semplice ma potente. Nella mia esperienza, Draft & Goal ha offerto risultati simili a Content At Scale, ma non ha un limite di conteggio delle parole in modo da poter scansionare lunghi commenti. Tuttavia, il tempo di scansione aumenta in base alla quantità di contenuto scansionato.

Per il mio testo di esempio, si dice che il 94% del testo è generato dall’intelligenza artificiale.

I miei pensieri 💭

Personalmente penso che l’aiuto dell’intelligenza artificiale sia in realtà un ottimo modo per rimuovere il blocco dello scrittore, ottenere tutte le informazioni in un unico posto e trovare ispirazione. Tuttavia, non dovrebbe mai sostituire la scrittura umana poiché l’intelligenza artificiale è limitata alla conoscenza già nota.

Puoi anche esplorare alcuni dei migliori strumenti di controllo del plagio per impedire la copia.