Tutto sul riconoscimento facciale per le aziende

Il riconoscimento facciale non è limitato ai regni dell’informatica. Ha solide applicazioni aziendali.

Una delle parole d’ordine più in voga di questo decennio è Riconoscimento facciale.

È la parte dell’apprendimento automatico applicato in grado di rilevare e identificare i volti umani, un problema notoriamente difficile per i computer fino ad ora. E questo ha aperto un mondo completamente nuovo di eccitanti possibilità e sfide per aziende, governi e individui allo stesso modo.

Se sei un leader aziendale e ti sei chiesto di cosa si tratta e se c’è qualche utilità in questo nuovo sviluppo, abbiamo quello che fa per te. In questo articolo, esamineremo la storia del riconoscimento facciale, il suo sviluppo, gli usi attuali, le controversie, l’implementazione e molti altri aspetti.

Alla fine, avrai una solida conoscenza di cosa è la tecnologia di riconoscimento facciale e quali sono le sue implicazioni per le aziende.

Iniziamo!

Evoluzione del riconoscimento facciale

La tecnologia è in circolazione da un po’ di tempo per tutto il clamore e la copertura mediatica che circonda il riconoscimento facciale. Il primo serio lavoro algoritmico nel rilevamento dei volti è stato il Framework di rilevamento degli oggetti Viola-Jones pubblicato nel 2001. Sebbene sia un framework generico per l’identificazione di oggetti all’interno delle immagini, è stato rapidamente applicato al rilevamento dei volti con un ottimo successo. Il motivo principale della popolarità di questo algoritmo era la sua velocità; mentre il processo di addestramento è stato estremamente lento, il processo di rilevamento è stato estremamente veloce.

Già nel 2001/2004, il computer desktop medio che eseguiva questo algoritmo era in grado di elaborare un frame di 300 px X 300 px in 0,07 secondi (altro qui). Il tassi di precisionesebbene non paragonabili a ciò che gli esseri umani possono ottenere, erano impressionanti al 90%.

Tuttavia, i veri progressi non sono stati compiuti fino al decennio 2010-2020, quando Reti neurali convoluzionali è emerso come il metodo migliore per eseguire il rilevamento facciale. Il motivo era la disponibilità di potenza di elaborazione grezza e gigantesche memorie di sistema rese disponibili tramite il cloud computing dai provider di Infrastructure-as-a-Service (IaaS). Per la prima volta nella storia, i computer battevano costantemente gli esseri umani nel riconoscere i volti, specialmente quando erano coinvolti un gran numero di volti casuali.

Fonte: medium.com

Come funziona il riconoscimento facciale?

Il riconoscimento facciale è un processo in più fasi con diversi sottosistemi specializzati coinvolti.

Ecco cosa significano le varie fasi:

Rilevamento/Tracciamento: questa parte della fase di preelaborazione è responsabile dell’identificazione e del tracciamento dei volti nell’immagine o nel file video specificato. Una volta completato questo processo, sappiamo per certo che c’è una faccia nell’input specificato e può essere ulteriormente elaborato. La fase di tracciamento è anche responsabile del tracciamento di determinate parti, caratteristiche particolari o espressioni di un volto, se necessario.

Allineamento: il problema del riconoscimento facciale è aggravato dal fatto che i volti in una determinata immagine o video non seguono alcuna linea guida. La persona potrebbe essere ingrandita o rimpicciolita, sbirciare da dietro un albero o essere presente in un profilo laterale, rendendo ancora più difficile il problema del rilevamento del volto. È qui che entra in gioco l’allineamento del viso: ci dice dove nell’immagine/video data si trovano le linee del viso e quali sono i contorni dei lineamenti del viso.

Fonte: csc.kth.se

Estrazione delle caratteristiche: come suggerisce il nome, durante questa fase del processo (ora siamo nella fase di Riconoscimento), le singole caratteristiche del viso, come occhi, naso, mento, labbra, ecc., vengono estratte nella forma che gli algoritmi possono utilizzare nella fase successiva. In questa fase, il computer ha raccolto dati abbastanza complessi da distinguere un volto in modo univoco.

Corrispondenza/classificazione delle caratteristiche: in questa fase, gli input ricevuti dall’estrazione delle caratteristiche vengono confrontati con il database specificato per dedurre l’identità della persona. Questa fase è anche nota come classificazione perché l’algoritmo potrebbe essere necessario per classificare i volti invece di identificarli individualmente.

Una volta terminato questo processo, sappiamo per certo se la faccia data fa parte del database con cui abbiamo confrontato o meno. L’output finale può anche contenere tag, come siamo abituati a vedere su Facebook.

Fonte: versodatascience.com

Considerazioni sulla distribuzione: lato server e lato client

Il riconoscimento facciale può funzionare sia sul server che sul dispositivo con cui l’utente sta interagendo. Ad esempio, quando carichi una foto su Facebook, gli algoritmi vengono eseguiti lato server; d’altra parte, un sistema ID che utilizza il tuo viso per sbloccare il dispositivo deve essere eseguito sul lato client. Quindi qual è il migliore?

Onestamente, non si tratta di quale sia il migliore. Sia le distribuzioni lato server che lato client hanno i loro punti di forza; in pratica, le aziende implementano un sistema ibrido. La pratica consigliata consiste nell’addestrare i modelli sul lato server, dove i dati di addestramento e le risorse di elaborazione sono illimitati. Una volta che i modelli sono stati addestrati, questi possono essere impacchettati e distribuiti sul lato client, il che migliora la velocità del sistema e mantiene la privacy dell’utente.

L’invio di tutto al server introduce un ritardo, che in alcuni casi può essere negativo o inaccettabile. Allo stesso tempo, mantenere tutto sul lato client si tradurrà in modelli più deboli.

Quanto è accurato il riconoscimento facciale?

La precisione non è un termine molto ben definito nel riconoscimento facciale. Il motivo principale è che si tratta di un problema confuso con tutti i tipi di input incasinati (luce scarsa, viso parzialmente coperto dai capelli, qualità della fotocamera, ecc.) E persino input ingannevoli (ne parleremo più avanti!). Di conseguenza, le reti neurali coinvolte nel riconoscimento facciale devono essere ottimizzate per il problema in questione, limitandone la portata. Quindi, mentre un sistema di riconoscimento facciale industriale potrebbe vantare una precisione del 100% (cosa che spesso accade), lo stesso sistema potrebbe non essere accurato nemmeno al 20% quando gli viene chiesto di identificare i volti in una foto affollata.

In uno ricerca, un particolare tipo di algoritmo di riconoscimento facciale è stato in grado di ottenere una precisione del 98,52%, superiore all’accuratezza umana del 97,53% raggiunta nello stesso test. In un altro studia condotto in ambito forense, la combinazione di giudizio umano e algoritmi ha prodotto in alcuni casi i risultati migliori.

In conclusione: per applicazioni mirate e ben definite, il riconoscimento facciale è lo strumento migliore che abbiamo.

Dove viene utilizzato il riconoscimento facciale?

Anche nel breve periodo in cui sono stati sviluppati algoritmi praticabili, il riconoscimento facciale ha trovato applicazioni incredibilmente utili ed eccitanti. Alcuni di questi sono cospicui, ma altri sono così sottilmente e fondamentalmente intrecciati nella vita di tutti i giorni che a malapena ci fermiamo a pensare a cosa c’è sotto.

Facebook è forse l’esempio più comune di moderni sistemi di riconoscimento facciale al lavoro. Non appena carichi una foto, il social network è in grado di rilevare i volti. Mentre qualche tempo fa ti veniva chiesto di taggare gli amici, ora Facebook è in grado di farlo da solo.

Fonte: labnol.org

Una nuova fantastica applicazione di Facebook è la caratteristica di informare utenti quando le foto contenenti i loro volti vengono caricate da qualcuno, anche se non sono state taggate in quelle foto.

Snapchat fa un uso massiccio del rilevamento e riconoscimento facciale per molte delle sue funzionalità, in particolare i filtri divertenti che sono una tale rabbia.

Fonte: gistreel.com

Affinché questi filtri funzionino, i contorni e le caratteristiche del viso del soggetto devono essere rilevati perfettamente, altrimenti le sovrapposizioni non sembreranno realistiche. Lo stesso vale per Face Swap, un’altra funzionalità popolare su Snapchat. Se sei interessato ad approfondire le capacità di Snapchat nel riconoscimento facciale, guarda qui.

Uber sta combattendo problemi di privacy e sicurezza da un po’ di tempo ormai e l’ultima arma nell’arsenale dell’azienda è il riconoscimento facciale. L’azienda ha implementato una nuova funzionalità in cui viene verificata l’identità dei suoi partner driver usando i loro volti. La società afferma sul suo blog che dopo aver testato diversi fornitori di tecnologia di riconoscimento facciale, hanno optato per l’API Microsoft Face per la sua alta qualità. È interessante notare che questo controllo ID in tempo reale funziona bene in condizioni di scarsa illuminazione ed è in grado di rilevare gli occhiali.

Con il riconoscimento facciale che si sta rivelando efficace in natura, è facile prevedere che potrebbe presto sostituire altri metodi di identificazione presso istituzioni educative, ospedali, biblioteche, ecc.

La prevenzione della criminalità al dettaglio è un’estensione naturale dell’applicazione del riconoscimento facciale. Il settore della vendita al dettaglio perde una stima 45 miliardi di dollari ogni anno a taccheggiatori e altri reati al dettaglio, con ben poco con cui contrastarlo. Ora, alle aziende piace Face First stanno aiutando i rivenditori a utilizzare il riconoscimento facciale per rilevare i precedenti trasgressori e allertare gli agenti di sicurezza.

La sorveglianza della polizia sta iniziando a sfruttare il riconoscimento facciale come tutte le altre istituzioni là fuori. Ad esempio, nel Regno Unito, la polizia del Galles del Sud utilizza le telecamere montate sui furgoni sorveglianza delle folle più facile.

Fonte: theconversation.com

Mentre questo ritrovato superpotere nelle mani della polizia ha acceso accesi dibattiti pubblici sulla privacy individuale, la polizia crede che li aiuterà a limitare meglio i trasgressori. Come ha detto Richard Lewis, vice capo della polizia del Galles del Sud Financial Times:

Se identifichi qualcuno che ha commesso un reato [previously]in pratica dici: sappiamo che sei qui, per favore comportati bene.

L’assistenza sanitaria ha recentemente avuto un’applicazione inaspettata, in cui il riconoscimento facciale ha aiutato a rilevare una rara malattia genetica chiamata sindrome di DiGeorge.

La sindrome di DiGeorge compare in circa 1 bambino su 6.000 e provoca deformità in diverse parti del corpo. Il problema sanitario, in questo caso, è più grave per i paesi più poveri, che non hanno le risorse per ricorrere a costose metodiche diagnostiche. In quanto tale, il riconoscimento facciale, con uno sbalorditivo precisione del 96,6%, offre una nuova speranza per le vittime della sindrome di DiGeorge.

Nel settore delle compagnie aeree, l’adozione del riconoscimento facciale sta prendendo piede e presto sostituirà le carte d’imbarco convenzionali. Attualmente, ci sono risultati limitati ma promettenti nell’aiutare identificare i passeggeri mentre lasciano il paese. Infatti, la Transport Security Administration (TSA) degli Stati Uniti ha predisposto a Piano per l’uso diffuso della biometria basata sul riconoscimento facciale.

Usi controversi del riconoscimento facciale

La tecnologia ci autorizza, anche se il suo uso buono o cattivo dipende da noi. Non c’è dubbio, quindi, che qualcosa di così potente e radicale come il riconoscimento facciale venga utilizzato in un modo che desta preoccupazione per i diritti umani e l’etica fondamentali.

L’esempio più importante di usi controversi del riconoscimento facciale è l’enorme Cina sistema di sorveglianza che impiega circa 200 milioni di telecamere per tenere d’occhio i suoi 1,4 miliardi di cittadini.

Fonte: sbs.com

Il sistema tiene traccia delle persone e ne valuta le azioni, aggiornando costantemente una metrica chiamata punteggio cittadino. Sebbene abbia un certo valore nell’avere un potente sistema di sorveglianza controllato dallo stato (per monitorare i debitori inadempienti, per esempio), la maggior parte lo vede come l’arrivo del futuro distopico immaginato da George Orwell. È un futuro in cui i governi hanno un potere illimitato sull’individuo e la privacy è inesistente.

Anche il secondo esempio dell’uso discutibile del riconoscimento facciale arriva (non sorprende?) dalla Cina. Questa volta, il sistema scolastico adotta il riconoscimento facciale per garantire che gli studenti siano “attenti” durante le lezioni. Il nuovo sistema di riconoscimento facciale, seppur non ancora diffuso, sostituisce le tessere d’identità, le tessere delle biblioteche, i sistemi di rilevazione presenze, ecc., utilizzando il volto dello studente per l’identificazione.

Fonte: businessinsider.com

Ma la parte inquietante è che questo sistema monitora i livelli di attenzione degli studenti, l’uso dei telefoni cellulari, ecc. e avvisa l’insegnante quando viene superata una certa soglia.

Sebbene la videosorveglianza basata sul riconoscimento facciale non sia un’esclusiva della Cina, gli Stati Uniti lo sono stati facendo sforzi usarlo per frenare la violenza armata nelle scuole: è la Cina che sembra andare oltre ogni altro paese.

Quando si tratta di utilizzare il riconoscimento facciale, quali opzioni hai? In questa sezione, esamineremo cosa è di uso comune e come le varie soluzioni si accumulano l’una contro l’altra.

Prima di iniziare, però: un promemoria che queste API si stanno evolvendo rapidamente e che probabilmente ti imbatterai in post di blog che dicono che questa API manca di questa o di quella caratteristica. Non prendere le tue decisioni in base a quello. Analizza prima le tue esigenze aziendali, controlla attentamente le funzionalità offerte, fai un percorso e solo allora prendi una decisione.

Apri CV

La ricerca sull’IA è una voragine senza fondo. La formazione e il perfezionamento di un sistema di riconoscimento facciale è difficile ed è meglio lasciare a conglomerati con tasche profonde e un esercito di ricercatori. Tuttavia, se le tue esigenze sono semplici e ti piace avere il pieno controllo e, naturalmente, sei pronto per il mantenimento di un piccolo/piccolo team di ingegneri,Apri CV potrebbe funzionare solo per te.

È una libreria di visione artificiale open source che è straordinariamente accurata ed è disponibile per tutte le piattaforme di programmazione. Ecco un rizzare i capelli esempio di come puoi creare un sistema di rilevamento dei volti con Python e OpenCV in 25 righe di codice!

Ora, potresti imbatterti in alcuni blog che dicono che OpenCV non ha il riconoscimento facciale. Bene, è una bugia completa, ed ecco qui prova. Tutto sommato, OpenCV può essere un’ottima scelta per la tua azienda se le esigenze sono semplici e specifiche.

Riconoscimento Amazon

Riconoscimento è un’offerta per impieghi gravosi di uno dei più grandi fornitori di cloud in circolazione: AWS. È un servizio potente e completamente gestito per la piattaforma AWS e, se stai già utilizzando AWS per la distribuzione, Rekognition è probabilmente la scelta migliore.

Alcune delle strabilianti funzionalità offerte da Recognition sono:

  • Analisi in tempo reale (mentre carichi un’immagine o un video su S3)
  • Analisi facciale approfondita (sesso, colore dei capelli, espressione facciale, occhi aperti o meno, ecc.)
  • Pathing (acquisizione di percorsi di oggetti identificati nei video)
  • Rilevamento di scene e attività (al chiuso/all’aperto, “giocare a calcio”, ecc.)
  • Moderazione di contenuti non sicuri (ad esempio la nudità)

Il più grande vantaggio di Rekognition è anche il più grande svantaggio: farai davvero fatica a usarlo con servizi non AWS al punto che dovrai semplicemente arrenderti.

Kairos

In netto contrasto con Recognition, Kairos ti fornisce l’IA su un’API (la rima non è intenzionale, lo giuriamo!), permettendoti di assumere il controllo completo dei tuoi dati e server. Kairos si propone come un servizio al primo posto per la privacy, e lo è estremamente critico di Amazon e di altre società in collusione con il governo (così è ACLUa proposito).

Kairos funziona sia su immagini che su video e ha tutte le belle funzionalità che ti aspetteresti da una moderna API di riconoscimento facciale. Fa alcune delle straordinarie funzionalità che si trovano in Rekognition, ma se non ne hai bisogno e stai già gestendo i tuoi dati, perché preoccuparti?!

Kairos ha una distribuzione in sede per coloro che sono paranoici sulla privacy e non vogliono nemmeno inviare dati via cavo per l’elaborazione, Kairos ha una distribuzione in sede, il prezzo dipende dal caso d’uso e può essere piuttosto elevato.

Google Cloud Vision

Google ha scelto di differenziare i suoi servizi di riconoscimento facciale per immagini e video. L’API dell’immagine è nota come Visione Nuvolamentre viene chiamato il servizio incentrato sul video Video Intelligenza.

Mentre il servizio incentrato sull’immagine è abbastanza simile a quello che AWS ha da offrire, il servizio video ha una bella funzionalità di catalogazione e ricerca. Ciò sarà utile per le aziende che dispongono di archivi video di grandi dimensioni che potrebbero voler analizzare o cercare.

Detto questo, Video Intelligence non dispone di funzionalità di riconoscimento facciale al momento della scrittura e queste sembrano essere offerte solo in Cloud Vision. Anche il tracciamento degli oggetti e il rilevamento del testo sono in versione beta, il che è molto dietro le offerte di Amazon.

API di Azure Face

Con Microsoft che prende le sue offerte cloud più seriamente di quelle desktop (finalmente), il API di Azure Face è una deliziosa offerta. Ha tutte le caratteristiche interessanti che ti aspetteresti (rilevamento, identificazione, raggruppamento dei volti, ricerca di volti simili, emozioni, ecc.) E funziona ugualmente bene con i video.

Ora, questo non è strettamente correlato al riconoscimento facciale, ma vale la pena ricordare che Azure offre anche una visione artificiale del cliente servizioche ti consente di utilizzare i tuoi input e addestrare i modelli secondo le tue esigenze.

Proprio come il servizio di Google, c’è un playground disponibile direttamente sulla home page, il che rende molto divertente testare l’API!

Ci sono differenze significative tra i principali servizi di riconoscimento facciale gestiti? Non proprio. C’è un’intensa concorrenza sul campo in questo momento e le nuove funzionalità vengono implementate più velocemente delle pizze. Se sei già legato a un particolare ecosistema, ha senso utilizzare il proprio servizio di riconoscimento facciale. In caso contrario, potresti voler scegliere un fornitore diverso se le tue esigenze sono specifiche (controllo dei tuoi dati, necessità di un semplice rilevamento, ecc.).

Sistemi di riconoscimento facciale

Proprio come alcuni ricercatori hanno dedicato la loro vita a perfezionare la tecnologia di riconoscimento facciale, altri sono impegnati a sviluppare tecniche per ingannarli. Uno di questi sviluppi interessanti è Occhiali contraddittoriche sembrano altrimenti normali per gli esseri umani ma hanno ingannato sistemi di riconoscimento facciale esperti.

Fonte: digitaltrends.com

Detto questo, questi occhiali non sono ancora disponibili sul mercato, anche se i ricercatori affermano che possono essere facilmente stampati in 3D.

Un altro sviluppo interessante è stato il lancio di eko occhiali su Kickstarter. Sebbene il prodotto sia ora annullato, ha funzionato su un’idea straordinariamente semplice: occhiali da sole semplici da tutti i giorni per $ 45 che riflettevano semplicemente la luce, facendo impazzire telecamere e dispositivi di videosorveglianza.

Proprio come il dominio della sicurezza informatica, “hacker” e ricercatori stanno bloccando i clacson nel riconoscimento facciale per la corsa alla perfezione. Intorno al 2014, abbiamo visto la popolarità di trucco mimetico che conferiva l’invisibilità al riconoscimento facciale, ma non sono più praticabili. Ci sarà una crittografia AES del riconoscimento facciale? Solo il tempo lo dirà!

Il riconoscimento facciale fa per te?

Il tipo di attività che può trarre vantaggio dal riconoscimento facciale è quella che coinvolge le persone, sì, il che significa tutte le attività là fuori! Sebbene gli usi attuali del riconoscimento facciale sembrino essere sostenuti da governi, grandi aziende o startup tecnologiche, non c’è motivo per cui la tua azienda non possa trarne vantaggio.

Le possibilità sono davvero infinite quando combiniamo un po’ di pensiero creativo: salutare e identificare i clienti in un hotel, localizzare il tuo amico in un mare di persone, trovare persone con facce simili (forse da usare come attori), individuare personalità per lavoro interviste (di nuovo, stiamo solo lasciando correre l’immaginazione qui; potrebbe non esserci nulla di sostanziale in uno studio del genere), personalizzando l’esperienza bancaria quando entra un cliente di alto valore . . . Esistono infiniti modi per utilizzare il riconoscimento facciale a livelli piccoli e grandi per migliorare le prestazioni della tua attività.

Conclusione

Ben presto il riconoscimento facciale diventerà così diffuso e così comune che non ce ne accorgeremo nemmeno (come i telefoni cellulari?). La tecnologia alla base è stata quasi perfezionata, ma nel mondo reale non si tratta solo di rilevare i volti, ma di cosa possiamo fare con questa capacità.

Sembra affascinante e sei interessato a saperne di più? Controlla questo brillante corso sulla Computer Vision.