Recenzja: Google Cloud AI rozświetla uczenie maszynowe

Google ma jeden z największych stosów systemów uczących się w branży, który obecnie koncentruje się na Google Cloud AI i Machine Learning Platform. Google wypuściło TensorFlow jako open source lata temu, ale TensorFlow jest nadal najbardziej dojrzałym i najczęściej cytowanym frameworkiem głębokiego uczenia się. Podobnie Google wiele lat temu wyodrębnił Kubernetes jako open source, ale nadal jest dominującym systemem zarządzania kontenerami.

Google jest jednym z głównych źródeł narzędzi i infrastruktury dla programistów, analityków danych i ekspertów ds. Uczenia maszynowego, ale w przeszłości sztuczna inteligencja Google nie była aż tak atrakcyjna dla analityków biznesowych, którzy nie mają poważnego doświadczenia w nauce o danych lub programowaniu. To zaczyna się zmieniać.

Google Cloud AI i Machine Learning Platform obejmują bloki konstrukcyjne sztucznej inteligencji, platformę i akceleratory sztucznej inteligencji oraz rozwiązania AI. Rozwiązania AI są dość nowe i skierowane raczej do menedżerów biznesowych, a nie do analityków danych. Mogą obejmować konsultacje z firmą Google lub jej partnerami.

Bloki konstrukcyjne sztucznej inteligencji, które są wstępnie przeszkolone, ale można je dostosowywać, mogą być używane bez gruntownej znajomości programowania lub nauki o danych. Niemniej jednak są one często używane przez wykwalifikowanych naukowców zajmujących się danymi z powodów pragmatycznych, zasadniczo w celu wykonania zadań bez intensywnego szkolenia modelowego.

Platforma AI i akceleratory są generalnie przeznaczone dla poważnych naukowców zajmujących się danymi i wymagają umiejętności kodowania, znajomości technik przygotowania danych i mnóstwa czasu na szkolenie. Polecam pójść tam dopiero po wypróbowaniu odpowiednich klocków.

W ofercie sztucznej inteligencji Google Cloud wciąż brakuje niektórych linków, zwłaszcza w zakresie przygotowywania danych. Usługa Google Cloud najbliższa do importu i kondycjonowania danych to zewnętrzna usługa Cloud Dataprep firmy Trifacta; Wypróbowałem to rok temu i byłem rozczarowany. Inżynieria funkcji wbudowana w Cloud AutoML Tables jest jednak obiecująca i warto byłoby mieć tego rodzaju usługę w innych scenariuszach.

Mądry spód sztucznej inteligencji ma związek z etyką i odpowiedzialnością (lub jej brakiem), a także z uporczywymi błędami modelowymi (często z powodu tendencyjnych danych wykorzystywanych do szkolenia). Google opublikował swoje zasady dotyczące sztucznej inteligencji w 2018 roku. Prace w tym zakresie są w toku, ale stanowią podstawę wskazówek, o których mowa w niedawnym poście na blogu poświęconym odpowiedzialnej sztucznej inteligencji.

Na rynku AI panuje duża konkurencja (kilkunastu dostawców) oraz duża konkurencja na rynku chmury publicznej (ponad pół tuzina wiarygodnych dostawców). Aby porównania były sprawiedliwe, musiałbym napisać artykuł co najmniej pięć razy dłuższy niż ten, więc chociaż nienawidzę ich pomijać, będę musiał pominąć większość porównań produktów. Podsumowując, mogę podsumować: AWS robi większość tego, co robi Google, i jest również bardzo dobry, ale generalnie pobiera wyższe ceny.

Bloki konstrukcyjne Google Cloud AI

Bloki konstrukcyjne Google Cloud AI to łatwe w użyciu komponenty, które można włączyć do własnych aplikacji, aby dodać widok, język, konwersację i dane strukturalne. Wiele bloków konstrukcyjnych sztucznej inteligencji to wstępnie wyszkolone sieci neuronowe, ale można je dostosować za pomocą uczenia transferu i wyszukiwania sieci neuronowych, jeśli nie spełniają one Twoich potrzeb po wyjęciu z pudełka. Tabele AutoML są nieco inne, ponieważ automatyzują proces, którego naukowiec ds. Danych użyłby do znalezienia najlepszego modelu uczenia maszynowego dla tabelarycznego zestawu danych.

AutoML

Usługi Google Cloud AutoML zapewniają dostosowane głębokie sieci neuronowe do tłumaczenia par językowych, klasyfikacji tekstu, wykrywania obiektów, klasyfikacji obrazów oraz klasyfikacji i śledzenia obiektów wideo. Wymagają oznaczonych danych do szkolenia, ale nie wymagają znacznej wiedzy na temat uczenia się głębokiego, uczenia transferowego ani programowania.

Google Cloud AutoML dostosowuje sprawdzone w walce, głębokie sieci neuronowe o wysokiej dokładności do Twoich oznaczonych danych. Zamiast zaczynać od zera podczas uczenia modeli z danych, AutoML implementuje automatyczne uczenie głębokiego transferu (co oznacza, że ​​zaczyna się od istniejącej głębokiej sieci neuronowej wyszkolonej na innych danych) i przeszukiwanie architektury neuronowej (co oznacza, że ​​znajduje odpowiednią kombinację dodatkowych warstw sieci ) do tłumaczenia par językowych i innych usług wymienionych powyżej.

W każdym obszarze Google ma już jedną lub więcej wstępnie przeszkolonych usług opartych na głębokich sieciach neuronowych i ogromnych zbiorach oznaczonych danych. Mogą one działać w przypadku niezmodyfikowanych danych i powinieneś to przetestować, aby zaoszczędzić czas i pieniądze. Jeśli nie robią tego, czego potrzebujesz, Google Cloud AutoML pomaga stworzyć model, który to robi, bez konieczności posiadania wiedzy, jak przeprowadzić naukę transferu lub jak projektować sieci neuronowe.

Uczenie się transferu ma dwie duże zalety w porównaniu z uczeniem sieci neuronowej od podstaw. Po pierwsze, wymaga dużo mniej danych do szkolenia, ponieważ większość warstw sieci jest już dobrze wyszkolona. Po drugie, trenuje dużo szybciej, ponieważ optymalizuje tylko ostatnie warstwy.

Chociaż usługi Google Cloud AutoML były kiedyś prezentowane razem jako pakiet, są teraz wymienione wraz z podstawowymi, wstępnie przeszkolonymi usługami. To, co większość innych firm nazywa AutoML, wykonuje Google Cloud AutoML Tables.

Przeczytaj pełną recenzję Google Cloud AutoML

Tabele AutoML

Zwykłym procesem nauki o danych dla wielu problemów związanych z regresją i klasyfikacją jest utworzenie tabeli danych do uczenia, czyszczenia i kondycjonowania danych, wykonywania inżynierii cech i próby wytrenowania wszystkich odpowiednich modeli w przekształconej tabeli, w tym kroku optymalizacji hiperparametry najlepszych modeli. Tabele Google Cloud AutoML mogą wykonać cały ten proces automatycznie po ręcznym zidentyfikowaniu pola docelowego.

Tabele AutoML automatycznie przeszukują model zoo Google w celu znalezienia uporządkowanych danych, aby znaleźć najlepszy model dla Twoich potrzeb, od modeli regresji liniowej / logistycznej dla prostszych zestawów danych po zaawansowane metody głębokiego, zespołowego i wyszukiwania architektury dla większych, bardziej złożonych. Automatyzuje inżynierię funkcji w szerokim zakresie tabelarycznych prymitywów danych - takich jak liczby, klasy, ciągi znaków, sygnatury czasowe i listy - oraz pomaga wykrywać i usuwać brakujące wartości, wartości odstające i inne typowe problemy z danymi.

Jego bezkodowy interfejs prowadzi Cię przez pełny cykl życia uczenia maszynowego, ułatwiając każdemu w Twoim zespole tworzenie modeli i niezawodne włączanie ich do szerszych aplikacji. Tabele AutoML zapewniają obszerne dane wejściowe i funkcje umożliwiające wyjaśnienie zachowania modelu, a także barierki zapobiegające typowym błędom. Tabele AutoML są również dostępne w środowiskach API i notebookach.

AutoML Tables konkuruje z Driverless AI i kilkoma innymi implementacjami i strukturami AutoML.

Vision API

Interfejs API Google Cloud Vision to wstępnie przeszkolona usługa uczenia maszynowego do kategoryzowania obrazów i wyodrębniania różnych funkcji. Może klasyfikować obrazy w tysiące wstępnie wytrenowanych kategorii, od ogólnych obiektów i zwierząt znalezionych na obrazie (takich jak kot), przez warunki ogólne (na przykład zmierzch), po określone punkty orientacyjne (Wieża Eiffla, Wielki Kanion), i określ ogólne właściwości obrazu, takie jak dominujące kolory. Może wyodrębnić obszary, które są twarzami, a następnie zastosować do nich analizy geometryczne (orientacja twarzy i punkty orientacyjne) i analizy emocjonalne, chociaż nie rozpoznaje twarzy jako należących do konkretnych osób, z wyjątkiem celebrytów (co wymaga specjalnej licencji na użytkowanie). Vision API wykorzystuje OCR do wykrywania tekstu w obrazach w ponad 50 językach i różnych typach plików. Może również identyfikować logo produktów i wykrywać osoby dorosłe,przemoc i treści medyczne.

Przeczytaj pełną recenzję interfejsów API Google Cloud Machine Learning

Video Intelligence API

Interfejs API Google Cloud Video Intelligence automatycznie rozpoznaje ponad 20 000 obiektów, miejsc i działań w przechowywanym i przesyłanym strumieniowo wideo. Wyróżnia również zmiany scen i wyodrębnia bogate metadane na poziomie wideo, ujęcia lub klatki. Dodatkowo wykonuje wykrywanie i wyodrębnianie tekstu za pomocą OCR, wykrywa wulgarne treści, automatyzuje napisy zamknięte i napisy, rozpoznaje logo oraz wykrywa twarze, osoby i pozy.

Google zaleca interfejs API Video Intelligence do wyodrębniania metadanych w celu indeksowania, organizowania i wyszukiwania treści wideo. Może transkrybować filmy i generować napisy, a także oznaczać i filtrować nieodpowiednie treści, a wszystko to w bardziej ekonomiczny sposób niż ludzkie transkrypcje. Przypadki użycia obejmują moderację treści, rekomendacje dotyczące treści, archiwa mediów i reklamy kontekstowe.

Interfejs API języka naturalnego

Przetwarzanie języka naturalnego (NLP) to duża część „tajnego sosu”, dzięki któremu dane wprowadzane do wyszukiwarki Google i Asystenta Google działają dobrze. Interfejs API Google Cloud Natural Language udostępnia tę samą technologię w Twoich programach. Może wykonywać analizę składni (patrz obrazek poniżej), wyodrębnianie jednostek, analizę sentymentów i klasyfikację treści w 10 językach. Możesz określić język, jeśli go znasz; w przeciwnym razie interfejs API spróbuje automatycznie wykryć język. Oddzielny interfejs API, obecnie dostępny do wczesnego dostępu na żądanie, specjalizuje się w treściach związanych z opieką zdrowotną.

Przeczytaj pełną recenzję interfejsów API Google Cloud Machine Learning

Tłumaczenie

Interfejs API Google Cloud Translation może przetłumaczyć ponad sto par językowych, może automatycznie wykryć język źródłowy, jeśli go nie określisz, i jest dostępny w trzech wersjach: podstawowym, zaawansowanym i tłumaczeniu multimediów. Interfejs API tłumaczenia zaawansowanego obsługuje słownik, tłumaczenie wsadowe i korzystanie z modeli niestandardowych. Podstawowy interfejs API tłumaczenia jest zasadniczo używany przez konsumencki interfejs Tłumacza Google. Tłumaczenie AutoML umożliwia trenowanie niestandardowych modeli za pomocą uczenia transferowego.

Interfejs API tłumaczenia mediów tłumaczy zawartość bezpośrednio z audio (mowy), plików audio lub strumieni, na 12 języków i automatycznie generuje znaki interpunkcyjne. Istnieją oddzielne modele audio wideo i rozmów telefonicznych.

Przeczytaj pełną recenzję interfejsów API Google Cloud Machine Learning