Alexa, Siri e Google non capiscono una parola che dici

Assistenti vocali come Alexa, Google Assistant e Siri hanno fatto molta strada negli ultimi anni. Ma, nonostante tutti i loro miglioramenti, una cosa li trattiene: non ti capiscono. Si affidano troppo a comandi vocali specifici.

Il riconoscimento vocale è solo un trucco magico

Gli assistenti vocali non ti capiscono. Non proprio, comunque. Quando parli con Google Home o Amazon Echo, essenzialmente converte le tue parole in una stringa di testo e quindi le confronta con i comandi previsti. Se trova una corrispondenza esatta, segue una serie di istruzioni. In caso contrario, cerca un’alternativa a cosa fare in base alle informazioni in suo possesso e, se non funziona, viene visualizzato un messaggio di errore del tipo “Mi dispiace, ma non lo so . ” È poco più che un gioco di prestigio per farti credere di capire.

Non può utilizzare indizi contestuali per fare la migliore ipotesi, o anche utilizzare una comprensione di argomenti simili per informare le sue decisioni. Non è nemmeno difficile far inciampare gli assistenti vocali. Mentre puoi chiedere ad Alexa “Lavori per la NSA?” e ottieni una risposta, se chiedi “Fai segretamente parte della NSA?” si ottiene una risposta “Non lo so” (almeno al momento della stesura di questo articolo).

Gli esseri umani, che capiscono veramente la parola, non funzionano in questo modo. Supponi di chiedere a un umano: “Cos’è quel klarvain nel cielo? Quello che è arcuato e pieno di colori a strisce come il rosso, l’arancione, il giallo e il blu. ” Nonostante klarvain sia una parola inventata, la persona che hai chiesto potrebbe probabilmente capire dal contesto che stai descrivendo un arcobaleno.

Mentre si potrebbe sostenere che un essere umano sta convertendo la parola in idee, un essere umano può quindi applicare la conoscenza e la comprensione per concludere una risposta. Se chiedi a un umano se lavora segretamente per la NSA, ti darà una risposta sì o no, anche se quella risposta è una bugia. Un umano non direbbe “Non lo so” a una domanda del genere. Che gli umani possano mentire è qualcosa che viene fornito con una vera comprensione.

Gli assistenti vocali non possono andare oltre la loro programmazione

Gli assistenti vocali sono in definitiva limitati ai parametri previsti programmati e vagare al di fuori di essi interromperà il processo. Questo fatto mostra quando entrano in gioco dispositivi di terze parti. Di solito, il comando per interagire con quelli è molto ingombrante, equivale a “dire al produttore del dispositivo di comandare un argomento opzionale”. Un esempio esatto potrebbe essere: “Di ‘a Whirlpool di mettere in pausa l’asciugatrice”. Per un esempio ancora più difficile da ricordare, il file Abilità di Ginevra Alexa controlla alcuni forni GE. Un utente dell’abilità deve ricordarsi di “dire a Geneva” non “dire a GE”, quindi il resto del comando. E mentre puoi chiedergli di preriscaldare il forno a 350 gradi, non puoi seguire una richiesta per aumentare la temperatura di altri 50 gradi. Tuttavia, un essere umano potrebbe seguire queste richieste.

Amazon e Google hanno lavorato molto duramente per superare questi ostacoli, e si vede. Se una volta dovevi seguire la sequenza di cui sopra per controllare una serratura intelligente, ora puoi invece dire “chiudi la porta d’ingresso”. Alexa era confusa da “raccontami una barzelletta sul cane”, ma chiedine una oggi e funzionerà. Hanno aggiunto variazioni ai comandi che usi, ma alla fine devi ancora conoscere il comando giusto da pronunciare. È necessario utilizzare la sintassi corretta, nell’ordine corretto.

E se pensi che assomigli molto a una riga di comando, non ti sbagli.

Gli assistenti vocali sono una riga di comando fantasia

Un prompt dei comandi con testo di ricerca

Una riga di comando è definita in modo restrittivo per eseguire attività semplici, ma solo se si conosce la sintassi corretta. Se esci dalla sintassi corretta e digiti dyr invece di dir, il prompt dei comandi ti darà un messaggio di errore. Puoi usare gli alias per ricordare i comandi più facilmente, ma devi avere un’idea di quali fossero i comandi originali, come funzionano e come usare gli alias in modo efficiente. Se non ti prendi il tempo per imparare i dettagli della riga di comando, non ne otterrai mai molto.

Gli assistenti vocali non sono diversi. Devi conoscere il modo corretto di pronunciare un comando o porre una domanda. E devi sapere come impostare gruppi per Google e Alexa, perché raggruppare i tuoi dispositivi è essenziale e come assegnare un nome ai tuoi dispositivi intelligenti. Se non segui questi passaggi necessari, sentirai la frustrazione di chiedere al tuo assistente vocale di chiudere lo studio solo per essere chiesto “quale studio” dovrebbe essere disattivato.

Anche quando si utilizza la sintassi corretta nell’ordine corretto, il processo potrebbe non riuscire. O con la risposta sbagliata o con un risultato sorprendente. Due case Google nella stessa casa possono fornire informazioni meteorologiche per località leggermente diverse anche se hanno accesso alle stesse informazioni sull’account utente e alla stessa connessione Internet.

Nell’esempio sopra, viene dato il comando “Imposta un timer per mezz’ora”. L’hub Google Home ha creato un timer denominato “Hour” e quindi ha chiesto la durata del timer. Eppure ripetere lo stesso comando altre tre volte ha funzionato correttamente e ha creato un timer di 30 minuti. L’uso del comando “Imposta un timer per 30 minuti” funziona correttamente su una base più coerente.

Mentre parlare con Google Home o Echo può essere più fluido, sotto il cofano gli assistenti vocali e le linee di comando funzionano allo stesso modo. Potrebbe non essere necessario imparare una nuova lingua, ma è necessario imparare un nuovo dialetto.

La comprensione ristretta degli assistenti vocali limiterà la crescita

Un hub di casa Google e un punto Echo davanti a una presa intelligente e una lampadina

Niente di tutto ciò impedisce agli assistenti vocali come Google Assistant e Alexa di funzionare abbastanza bene (sebbene Cortana sia una storia diversa). Google Assistant e Alexa e cercano in linea le domande in modo decente, anche se non sorprende che Google sia migliore nella ricerca e possa rispondere a domande di base come conversioni di misurazione e matematica semplice. Con una smart home configurata correttamente e un utente ben addestrato, la maggior parte dei comandi smart home funzionerà come previsto. Ma questo è venuto attraverso il lavoro e lo sforzo, non la comprensione intellettuale.

I timer e gli allarmi erano semplicistici. Nel tempo è stata aggiunta la denominazione, quindi la possibilità di aggiungere tempo a un timer. Sono passati da semplicistici a più complicati. Gli assistenti vocali possono rispondere a più domande e ogni giorno apporta nuove capacità e funzionalità. Ma questo non è un prodotto della crescita personale che deriva dall’apprendimento e dalla comprensione.

E niente di tutto ciò offre la capacità intrinseca di utilizzare ciò che è noto per raggiungere l’ignoto. Per ogni comando e domanda che funziona, ce ne saranno sempre tre che non funzionano. Senza una svolta nell’intelligenza artificiale che garantisce una capacità di comprensione simile a quella umana, gli assistenti vocali non sono affatto assistenti. Sono solo righe di comando vocale, utili nello scenario giusto ma limitate a quegli scenari per cui sono stati programmati per essere compresi.

In altre parole: le macchine stanno imparando cose, ma non riescono a capirle.