Come funziona il riconoscimento facciale?

La maggior parte delle persone si sente a proprio agio con il riconoscimento facciale per il suo utilizzo nei filtri di Instagram e Face ID. Ma questa tecnologia relativamente nuova può sembrare un po ‘inquietante. Il tuo viso è come un’impronta digitale e la tecnologia alla base del riconoscimento facciale è complessa.

Come con qualsiasi nuova tecnologia, ci sono degli svantaggi nel riconoscimento facciale. Questi svantaggi stanno diventando più evidenti quando i militari, la polizia, inserzionistie i creatori di deepfake, trovano nuovi modi subdoli per sfruttare il software di riconoscimento facciale.

Ora più che mai, è essenziale per le persone capire come funziona il riconoscimento facciale. È anche importante conoscere i limiti del riconoscimento facciale e come si svilupperà in futuro.

Il riconoscimento facciale è sorprendentemente semplice

Prima di entrare nei molti mezzi diversi per il riconoscimento facciale, è importante capire come funziona il processo di riconoscimento facciale. Ecco tre applicazioni per il software di riconoscimento facciale e una semplice spiegazione di come riconoscono o identificano i volti:

Riconoscimento facciale di base: per i filtri Animoji e Instagram, la fotocamera del telefono “cerca” le caratteristiche distintive di un viso, in particolare un paio di occhi, un naso e una bocca. Quindi, utilizza algoritmi per bloccare un viso e determinare in quale direzione sta guardando, se la sua bocca è aperta, ecc. Vale la pena ricordare che questa non è l’identificazione facciale, è solo un software che cerca volti.
Face ID e programmi simili: dopo aver impostato Face ID (o programmi simili) sul telefono, scatta una foto del tuo viso e misura la distanza tra i tratti del viso. Quindi, ogni volta che vai a sbloccare il telefono, “guarda” attraverso la fotocamera per misurare e confermare la tua identità.
Identificazione di uno sconosciuto: quando un’organizzazione desidera identificare un volto per scopi di sicurezza, pubblicità o polizia, utilizza algoritmi per confrontare quel volto con un ampio database di volti. Questo processo è quasi identico al Face ID di Apple ma su scala più ampia. Teoricamente, qualsiasi database potrebbe essere utilizzato (carte d’identità, profili Facebook), ma l’ideale è un database di foto chiare e pre-identificate.

Va bene, entriamo nel nocciolo della questione. Poiché il “riconoscimento facciale di base” utilizzato per i filtri di Instagram è un processo così semplice e innocuo, ci concentreremo interamente sull’identificazione del viso e sulle molte tecnologie diverse che possono essere utilizzate per identificare un volto.

La maggior parte del riconoscimento facciale si basa su immagini 2D

Come ci si aspetterebbe, la maggior parte dei software di riconoscimento facciale si basa interamente su immagini 2D. Ma questo non viene fatto perché l’imaging facciale 2D è estremamente accurato, è fatto per comodità. La stragrande maggioranza delle fotocamere scatta foto senza profondità e le foto pubbliche che possono essere utilizzate per i database di riconoscimento facciale (immagini del profilo Facebook, ad esempio) sono tutte in 2D.

Perché l’imaging facciale 2D non è estremamente accurato? Bene, perché un’immagine piatta del tuo viso manca di caratteristiche identificative, come la profondità. Con un’immagine piatta, un computer può misurare la distanza pupillare e la larghezza della bocca, tra le altre variabili. Ma non può dire la lunghezza del tuo naso o la prominenza della tua fronte.

Inoltre, l’imaging facciale 2D si basa sullo spettro della luce visibile. Ciò significa che l’imaging facciale 2D non funziona al buio e può essere inaffidabile in condizioni di illuminazione funky o ombreggiata.

Chiaramente, il modo per aggirare alcune di queste carenze consiste nell’utilizzare l’imaging facciale 3D. Ma come è possibile? Hai bisogno di attrezzature speciali per vedere una faccia in 3D?

Le telecamere IR aggiungono profondità alla tua identità

Sebbene alcune applicazioni di riconoscimento facciale si basino esclusivamente su immagini 2D, non è raro che il riconoscimento facciale si basi anche sull’imaging 3D. In effetti, la tua esperienza con il riconoscimento facciale probabilmente coinvolge un pizzico di 3D.

Ciò si ottiene tramite una tecnica chiamata lidar, che è simile al sonar. In sostanza, i dispositivi di scansione del viso, come il tuo iPhone, lanciano una matrice IR innocua sul tuo viso. Questa matrice (un muro di laser) si riflette quindi sul tuo viso e viene rilevata da una fotocamera IR (o fotocamera ToF) sul tuo telefono.

Una donna che utilizza Face ID o una tecnologia di riconoscimento facciale simile basata su IR.

Dove avviene la magia 3D? La fotocamera IR del telefono misura quanto tempo impiega ogni bit di luce IR a rimbalzare sul tuo viso e tornare al telefono. Naturalmente, la luce che si riflette sul tuo naso avrà un viaggio più breve della luce che si riflette sulle tue orecchie e la telecamera IR utilizza queste informazioni per creare una mappa di profondità unica del tuo viso. Se utilizzato insieme all’imaging 2D di base, l’imaging 3D può aumentare notevolmente la precisione del software di riconoscimento facciale.

L’imaging Lidar è un concetto strano che può essere difficile da comprendere. Se aiuta, prova a immaginare che la mesh IR del tuo telefono (o qualsiasi dispositivo di riconoscimento facciale) sia un file giocattolo da bacheca. Come una bacheca, il tuo viso lascia una rientranza nella rete IR, dove il tuo naso è notevolmente più profondo di, diciamo, i tuoi occhi.

La termografia consente il riconoscimento facciale di notte

Uno dei difetti del riconoscimento facciale 2D è che si basa sullo spettro visibile della luce. In parole povere, il riconoscimento facciale di base non funziona al buio. Ma questo può essere aggirato utilizzando una termocamera (sì, come in Tom Clancy).

“Aspetta un minuto”, potresti dire, “la termografia non si basa sulla luce IR?” Sì, lo fa. Ma le termocamere non emettono esplosioni di luce IR; rilevano semplicemente la luce IR emessa dagli oggetti. Gli oggetti caldi emettono una tonnellata di luce IR, mentre gli oggetti freddi emettono una quantità trascurabile di luce IR. Le costose termocamere possono persino rilevare sottili differenze di temperatura su una superficie, quindi la tecnologia è ideale per il riconoscimento facciale.

Tre foto.  La prima proviene dallo spettro della luce visibile, la seconda è un'immagine termica fissa e la terza è un'immagine termica composita.Un’immagine dello spettro della luce visibile, un’immagine termica e un’immagine termica composita.

Ci sono manciata di modi diversi per identificare un volto con la termografia. Tutte queste tecniche sono incredibilmente complicate, ma condividono alcune somiglianze fondamentali, quindi proveremo a mantenere le cose semplici con un elenco:

Sono necessarie più foto: una termocamera scatta più foto del viso di un soggetto. Ogni foto si concentra su un diverso spettro di luce IR (onde lunghe, corte e medie). In genere, lo spettro delle onde lunghe fornisce il maggior dettaglio del viso.
Le mappe dei vasi sanguigni sono utili: queste immagini IR possono essere utilizzate anche per estrarre la formazione dei vasi sanguigni sul viso di una persona. È inquietante, ma le mappe dei vasi sanguigni possono essere utilizzate come impronte digitali facciali uniche. Possono anche essere usati per trovare la distanza tra gli organi facciali (se la tipica termografia produce immagini scadenti) o per identificare lividi e cicatrici.
Il soggetto può essere identificato: un’immagine composita (o set di dati) viene creata utilizzando più immagini IR. Questa immagine composita può quindi essere confrontata con un database facciale per identificare il soggetto.

Ovviamente, il riconoscimento facciale termico viene solitamente utilizzato dai militari, non è qualcosa che troverai a Khols e non è qualcosa che arriverà con il tuo prossimo cellulare. Inoltre, la termografia non funziona bene durante il giorno (o in ambienti generalmente ben illuminati), quindi non ha molte potenziali applicazioni al di fuori dell’esercito.

Limitazioni del riconoscimento facciale

Abbiamo passato molto tempo a parlare delle carenze del riconoscimento facciale. Come abbiamo visto dall’IR e dalla termografia, è possibile superare alcune di queste limitazioni. Ma ci sono ancora alcuni problemi che non sono stati ancora risolti:

Ostruzione: come ci si aspetterebbe, occhiali da sole e altri accessori possono inciampare nel software di riconoscimento facciale.
Pose: il riconoscimento facciale funziona meglio con un’immagine neutra rivolta in avanti. Un’inclinazione o una rotazione della testa possono rendere difficile il riconoscimento facciale, anche per il software di riconoscimento basato su IR. Inoltre, un sorriso, le guance gonfie o qualsiasi altra posa possono cambiare il modo in cui un computer misura il tuo viso.
Luce: tutte le forme di riconoscimento facciale si basano sulla luce, che si tratti di spettro visibile o luce IR. Di conseguenza, condizioni di illuminazione strane possono diminuire la precisione dell’identificazione facciale. Questo potrebbe cambiare, poiché gli scienziati stanno attualmente sviluppando tecnologia di riconoscimento facciale basata su sonar.
Il database: senza un buon database, il riconoscimento facciale non può funzionare. Sulla stessa linea, è impossibile identificare un volto che non è stato identificato correttamente in passato.
Elaborazione dati: a seconda delle dimensioni e del formato di un database, i computer possono impiegare del tempo per identificare correttamente i volti. In alcune situazioni, come le attività di polizia, le limitazioni nell’elaborazione dei dati limitano l’uso dell’identificazione facciale per le applicazioni quotidiane (il che è probabilmente una buona cosa).

A partire da ora, il modo migliore per aggirare queste limitazioni è utilizzare altre forme di identificazione insieme al riconoscimento facciale. Il telefono chiederà una password o un’impronta digitale se non riesce a identificare il tuo viso e il file Governo cinese utilizza carte d’identità e tecnologia di tracciamento per chiudere il margine di errore esistente nella sua rete di riconoscimento facciale.

In futuro, gli scienziati troveranno sicuramente un modo per aggirare questi problemi. Possono utilizzare la tecnologia sonar insieme al lidar per creare mappe facciali 3D in qualsiasi ambiente e possono trovare modi per elaborare i dati del viso (e identificare gli estranei) in un tempo incredibilmente breve. In ogni caso, questa tecnologia ha un grande potenziale di abuso, quindi vale la pena tenere il passo.

Fonti: L’Università di Rijeka, La Electronic Frontier Foundation