Co to jest rozpoznawanie twarzy? AI dla Big Brother

Czy Wielki Brat może zidentyfikować Twoją twarz na podstawie monitoringu CCTV na poziomie ulicy i stwierdzić, czy jesteś szczęśliwy, smutny czy zły? Czy ta identyfikacja może doprowadzić do twojego aresztowania na podstawie ważnego nakazu? Jakie są szanse, że identyfikacja jest nieprawidłowa i naprawdę łączy się z kimś innym? Czy możesz całkowicie pokonać nadzór, używając jakiejś sztuczki?

Z drugiej strony, czy możesz dostać się do skarbca chronionego przez aparat i oprogramowanie do identyfikacji twarzy, trzymając odcisk twarzy osoby upoważnionej? A co jeśli założysz trójwymiarową maskę twarzy osoby upoważnionej?

Witamy w rozpoznawaniu twarzy - i fałszowaniu rozpoznawania twarzy.

Co to jest rozpoznawanie twarzy?

Rozpoznawanie twarzy to metoda identyfikacji nieznanej osoby lub uwierzytelnienia tożsamości konkretnej osoby na podstawie jej twarzy. Jest to gałąź widzenia komputerowego, ale rozpoznawanie twarzy jest wyspecjalizowane i wiąże się z bagażem społecznościowym w przypadku niektórych aplikacji, a także z pewnymi podatnościami na fałszowanie.

Jak działa rozpoznawanie twarzy?

Wczesne algorytmy rozpoznawania twarzy (które są nadal w użyciu w ulepszonej i bardziej zautomatyzowanej formie) opierają się na danych biometrycznych (takich jak odległość między oczami), aby przekształcić zmierzone cechy twarzy z dwuwymiarowego obrazu w zestaw wektor lub szablon) opisujący twarz. Proces rozpoznawania następnie porównuje te wektory z bazą danych znanych twarzy, które zostały odwzorowane na cechy w ten sam sposób. Jedną z komplikacji w tym procesie jest dostosowanie twarzy do znormalizowanego widoku, aby uwzględnić obrót i pochylenie głowy przed wyodrębnieniem metryk. Ta klasa algorytmów nosi nazwę geometrii .

Innym podejściem do rozpoznawania twarzy jest normalizacja i kompresja dwuwymiarowych obrazów twarzy oraz porównanie ich z bazą danych podobnie znormalizowanych i skompresowanych obrazów. Ta klasa algorytmów nosi nazwę fotometrii .

Trójwymiarowe rozpoznawanie twarzy wykorzystuje czujniki 3-D do przechwytywania obrazu twarzy lub rekonstruuje obraz 3-D z trzech kamer śledzących 2-D skierowanych pod różnymi kątami. Rozpoznawanie twarzy 3D może być znacznie dokładniejsze niż rozpoznawanie 2D.

Analiza tekstury skóry odwzorowuje linie, wzory i plamy na twarzy osoby na inny wektor cech. Dodanie analizy tekstury skóry do dwu- lub trójwymiarowego rozpoznawania twarzy może poprawić dokładność rozpoznawania o 20 do 25 procent, zwłaszcza w przypadku podobnych do siebie i bliźniaków. Możesz także łączyć wszystkie metody i dodawać obrazy wielospektralne (światło widzialne i podczerwień), aby uzyskać jeszcze większą dokładność.

Rozpoznawanie twarzy poprawia się z roku na rok od rozpoczęcia tej dziedziny w 1964 r. Średnio poziom błędu zmniejsza się o połowę co dwa lata.

Powiązane wideo: Jak działa rozpoznawanie twarzy

Testy dostawców rozpoznawania twarzy

NIST, amerykański Narodowy Instytut Standardów i Technologii, od 2000 r. Przeprowadza testy algorytmów rozpoznawania twarzy - Face Recognition Vendor Test (FRVT). Wykorzystywane zbiory danych obrazu to głównie zdjęcia zrobione przez organy ścigania, ale obejmują również in-the- dzikie obrazy nieruchome, takie jak te znalezione w Wikimedia, oraz obrazy o niskiej rozdzielczości z kamer internetowych.

Algorytmy FRVT są głównie dostarczane przez dostawców komercyjnych. Porównania rok do roku pokazują znaczny wzrost wydajności i dokładności; według dostawców wynika to przede wszystkim z zastosowania głębokich konwolucyjnych sieci neuronowych.

Powiązane programy testowania rozpoznawania twarzy NIST badały skutki demograficzne, wykrywanie morfingu twarzy, identyfikację twarzy opublikowanych w mediach społecznościowych oraz identyfikację twarzy na wideo. Poprzednia seria testów została przeprowadzona w latach 90-tych pod inną nazwą: Technologia rozpoznawania twarzy (FERET).

NIST

Aplikacje do rozpoznawania twarzy

Aplikacje do rozpoznawania twarzy najczęściej dzielą się na trzy główne kategorie: bezpieczeństwo, zdrowie i marketing / handel detaliczny. Bezpieczeństwo obejmuje egzekwowanie prawa, a ta klasa zastosowań rozpoznawania twarzy może być równie niegroźna, jak dopasowywanie ludzi do zdjęć paszportowych szybciej i dokładniej niż ludzie, i tak przerażająca jak scenariusz „Osoba zainteresowana”, w którym ludzie są śledzeni przez CCTV i porównywane do zebranych baz danych zdjęć. Bezpieczeństwo niezwiązane z egzekwowaniem prawa obejmuje typowe zastosowania, takie jak odblokowywanie twarzą do telefonów komórkowych oraz kontrola dostępu do laboratoriów i skarbców.

Zastosowania zdrowotne rozpoznawania twarzy obejmują rejestrację pacjentów, wykrywanie emocji w czasie rzeczywistym, śledzenie pacjentów w placówce, ocenę poziomu bólu u pacjentów niewerbalnych, wykrywanie określonych chorób i stanów, identyfikację personelu oraz bezpieczeństwo placówki. Marketingowe i detaliczne zastosowania rozpoznawania twarzy obejmują identyfikację członków programu lojalnościowego, identyfikację i śledzenie znanych złodziei oraz rozpoznawanie ludzi i ich emocji w celu uzyskania ukierunkowanych sugestii dotyczących produktów.

Kontrowersje, uprzedzenia i zakazy dotyczące rozpoznawania twarzy

Stwierdzenie, że niektóre z tych aplikacji są kontrowersyjne, to za mało. Jak mówi artykuł w New York Times z 2019 roku, rozpoznawanie twarzy budzi kontrowersje, od jego wykorzystania do nadzoru stadionów po rasistowskie oprogramowanie.

Monitoring stadionu? Rozpoznawanie twarzy zostało użyte na Super Bowl w 2001 roku: oprogramowanie zidentyfikowało 19 osób, które uważano za objęte zaległymi nakazami, ale żadna nie została aresztowana (nie z powodu braku prób).

Oprogramowanie rasistowskie? Wystąpiło kilka problemów, począwszy od oprogramowania do śledzenia twarzy z 2009 roku, które mogło śledzić białych, ale nie czarnych, i kontynuując badanie MIT z 2015 roku, które wykazało, że oprogramowanie do rozpoznawania twarzy w tamtych czasach działało znacznie lepiej na białych męskich twarzach niż kobiety i / lub Czarne twarze.

Tego rodzaju problemy doprowadziły do ​​całkowitego zakazu używania oprogramowania do rozpoznawania twarzy w określonych miejscach lub do określonych zastosowań. W 2019 roku San Francisco stało się pierwszym dużym amerykańskim miastem, które zablokowało policji i innym organom ścigania korzystanie z oprogramowania do rozpoznawania twarzy; Microsoft wezwał do federalnych przepisów dotyczących rozpoznawania twarzy; a MIT wykazało, że Amazon Rekognition miał więcej problemów z określeniem płci żeńskiej niż męskiej na podstawie zdjęć twarzy, a także więcej problemów z czarną płcią żeńską niż białą.

W czerwcu 2020 roku Microsoft ogłosił, że nie będzie sprzedawał ani nie sprzedał policji swojego oprogramowania do rozpoznawania twarzy; Amazon zakazał policji używania Rekognition przez rok; a IBM porzucił technologię rozpoznawania twarzy. Całkowity zakaz rozpoznawania twarzy nie będzie jednak łatwy, biorąc pod uwagę jego powszechne zastosowanie w iPhone'ach (Face ID) oraz innych urządzeniach, oprogramowaniu i technologiach.

Nie wszystkie programy do rozpoznawania twarzy mają takie same uprzedzenia. Badanie efektów demograficznych NIST z 2019 r. Stanowiło kontynuację prac MIT i wykazało, że algorytmiczne uprzedzenia demograficzne różnią się znacznie w zależności od twórców oprogramowania do rozpoznawania twarzy. Tak, istnieją skutki demograficzne dotyczące współczynnika fałszywego dopasowania i wskaźnika fałszywego niedopasowania algorytmów identyfikacji twarzy, ale mogą się one różnić o kilka rzędów wielkości w zależności od dostawcy i maleją z biegiem czasu.

Rozpoznawanie twarzy hakowania i techniki przeciwdziałania spoofingowi

Biorąc pod uwagę potencjalne zagrożenie prywatności wynikające z rozpoznawania twarzy oraz atrakcyjność dostępu do wartościowych zasobów chronionych przez uwierzytelnianie twarzą, podjęto wiele prób włamania lub sfałszowania technologii. Możesz przedstawić wydrukowany obraz twarzy zamiast żywej twarzy lub obraz na ekranie lub wydrukowaną w 3D maskę, aby przejść uwierzytelnianie. W przypadku monitoringu CCTV można odtwarzać wideo. Aby uniknąć inwigilacji, możesz wypróbować tkaniny i makijaż „CV Dazzle” i / lub emitery podczerwieni, aby oszukać oprogramowanie tak, aby nie wykrywało Twojej twarzy.

Oczywiście podejmowane są wysiłki mające na celu opracowanie technik przeciwdziałających spoofingowi dla wszystkich tych ataków. Aby wykryć drukowane obrazy, sprzedawcy stosują testy na żywo, takie jak oczekiwanie na mrugnięcie obiektu, wykonanie analizy ruchu lub użycie podczerwieni do odróżnienia żywej twarzy od wydrukowanego obrazu. Innym podejściem jest wykonanie analizy mikrotekstury, ponieważ ludzka skóra różni się optycznie od wydruków i materiałów maskujących. Najnowsze techniki zapobiegania fałszowaniu opierają się głównie na głębokich konwolucyjnych sieciach neuronowych.

To ewoluująca dziedzina. Trwa wojna zbrojeniowa między napastnikami a oprogramowaniem zapobiegającym spoofingowi, a także akademickie badania nad skutecznością różnych technik ataku i obrony.

Dostawcy rozpoznawania twarzy

Według Electronic Frontier Foundation, MorphoTrust, spółka zależna Idemia (wcześniej znana jako OT-Morpho lub Safran), jest jednym z największych dostawców technologii rozpoznawania twarzy i innych technologii identyfikacji biometrycznej w Stanach Zjednoczonych. Zaprojektował systemy dla stanowych DMV, federalnych i stanowych organów ścigania, kontroli granicznej i lotnisk (w tym TSA PreCheck) oraz departamentu stanowego. Inni popularni dostawcy to 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst i NEC Global.

Test dostawcy rozpoznawania twarzy NIST zawiera listę algorytmów wielu innych dostawców z całego świata. Istnieje również kilka algorytmów rozpoznawania twarzy typu open source o różnej jakości oraz kilka głównych usług w chmurze, które oferują rozpoznawanie twarzy.

Amazon Rekognition to usługa analizy obrazów i wideo, która może identyfikować obiekty, osoby, tekst, sceny i czynności, w tym analizę twarzy i niestandardowe etykiety. Interfejs API Google Cloud Vision to wstępnie wyszkolona usługa analizy obrazów, która może wykrywać obiekty i twarze, czytać wydrukowany i odręczny tekst oraz umieszczać metadane w katalogu obrazów. Google AutoML Vision umożliwia trenowanie niestandardowych modeli obrazów.

Interfejs Azure Face API umożliwia wykrywanie twarzy, które rozpoznaje twarze i atrybuty na obrazie, przeprowadza identyfikację osoby, która pasuje do osoby w Twoim prywatnym repozytorium obejmującym do 1 miliona osób, i przeprowadza rozpoznawanie postrzeganych emocji. Face API może działać w chmurze lub na brzegu sieci w kontenerach.

Zestawy danych twarzy do treningu rozpoznawania

Istnieją dziesiątki zestawów danych twarzy do pobrania, które można wykorzystać do treningu rozpoznawania. Nie wszystkie zestawy danych twarzy są równe: zwykle różnią się rozmiarem obrazu, liczbą reprezentowanych osób, liczbą obrazów na osobę, stanami obrazów i oświetleniem. Organy ścigania mają również dostęp do niepublicznych zbiorów danych dotyczących twarzy, takich jak aktualne zdjęcia mugshot i obrazy prawa jazdy.

Niektóre z większych baz danych twarzy są oznaczone etykietami „Faces in the Wild” i zawierają około 13 000 unikalnych osób; FERET, używany do wczesnych testów NIST; baza danych Mugshot używana w trwającym NIST FRVT; baza danych kamer monitorujących SCFace, dostępna również z punktami orientacyjnymi twarzy; i oznaczone twarze Wikipedii z ~ 1,5 tys. unikatowych tożsamości. Kilka z tych baz danych zawiera wiele obrazów na tożsamość. Ta lista opracowana przez badacza Ethana Meyersa zawiera przekonywujące porady dotyczące wyboru zestawu danych twarzy do określonego celu.

Podsumowując, rozpoznawanie twarzy jest coraz lepsze, a dostawcy uczą się wykrywać większość przypadków fałszowania, ale niektóre zastosowania tej technologii są kontrowersyjne. Według NIST wskaźnik błędu w rozpoznawaniu twarzy zmniejsza się o połowę co dwa lata. Sprzedawcy ulepszyli swoje techniki przeciwdziałania spoofingowi, wprowadzając konwolucyjne sieci neuronowe.

W międzyczasie pojawiają się inicjatywy zakazujące wykorzystywania rozpoznawania twarzy w inwigilacji, zwłaszcza przez policję. Całkowity zakaz rozpoznawania twarzy byłby jednak trudny, biorąc pod uwagę jego powszechność.

Przeczytaj więcej o uczeniu maszynowym i uczeniu głębokim:

  • Uczenie głębokie a uczenie maszynowe: zrozumienie różnic
  • Co to jest uczenie maszynowe? Inteligencja pochodząca z danych
  • Co to jest uczenie głębokie? Algorytmy naśladujące ludzki mózg
  • Wyjaśnienie algorytmów uczenia maszynowego
  • Automatyczne uczenie maszynowe lub wyjaśnienie AutoML
  • Wyjaśnienie nadzorowanego uczenia się
  • Wyjaśnienie uczenia się częściowo nadzorowanego
  • Wyjaśnienie uczenia się bez nadzoru
  • Wyjaśnienie uczenia się ze wzmocnieniem
  • Co to jest wizja komputerowa? AI dla obrazów i wideo
  • Co to jest rozpoznawanie twarzy? AI dla Big Brother
  • Co to jest przetwarzanie języka naturalnego? AI dla mowy i tekstu
  • Kaggle: Tam, gdzie naukowcy zajmujący się danymi uczą się i rywalizują
  • Co to jest CUDA? Równoległe przetwarzanie dla GPU