Granskning: Google Cloud AI tänder maskininlärning

Google har en av de största maskininlärningsstaplarna i branschen, för närvarande centrerad på sin Google Cloud AI och Machine Learning Platform. Google spred ut TensorFlow som öppen källkod för år sedan, men TensorFlow är fortfarande den mest mogna och mest citerade ramverket för djupinlärning. På samma sätt spred Google ut Kubernetes som öppen källkod för år sedan, men det är fortfarande det dominerande containerhanteringssystemet.

Google är en av de bästa källorna till verktyg och infrastruktur för utvecklare, dataforskare och maskininlärningsexperter, men historiskt har Google AI inte varit så attraktivt för affärsanalytiker som saknar seriös datavetenskap eller programmeringsbakgrund. Det börjar förändras.

Google Cloud AI och Machine Learning Platform inkluderar AI-byggstenar, AI-plattformen och acceleratorer och AI-lösningar. AI-lösningarna är ganska nya och riktar sig till affärschefer snarare än dataforskare. De kan inkludera konsultation från Google eller dess partners.

AI-byggstenarna, som är förutbildade men anpassningsbara, kan användas utan intim kunskap om programmering eller datavetenskap. Ändå används de ofta av skickliga datavetare av pragmatiska skäl, i huvudsak för att få saker gjorda utan omfattande modellutbildning.

AI-plattformen och acceleratorerna är i allmänhet för seriösa dataforskare och kräver kodningsförmåga, kunskap om dataförberedelsestekniker och mycket utbildningstid. Jag rekommenderar att åka dit först efter att ha provat relevanta byggstenar.

Det finns fortfarande några saknade länkar i Google Clouds AI-erbjudanden, särskilt vid dataförberedelse. Det närmaste som Google Cloud har till en dataimport- och konditioneringstjänst är tredjeparts Cloud Dataprep av Trifacta; Jag försökte det för ett år sedan och var överväldigad. Funktionsteknik inbyggd i Cloud AutoML-tabeller är dock lovande, och det skulle vara användbart att ha den typen av tjänster tillgängliga för andra scenarier.

Den snygga undersidan av AI har att göra med etik och ansvar (eller bristen på dem), tillsammans med ihållande modellförspänningar (ofta på grund av partisk data som används för träning). Google publicerade sina AI-principer 2018. Det är ett pågående arbete, men det är en grund för vägledning som diskuterades i ett nyligen blogginlägg om ansvarsfull AI.

Det finns mycket konkurrens på AI-marknaden (över ett dussin leverantörer) och mycket konkurrens på den offentliga molnmarknaden (över ett halvt dussin trovärdiga leverantörer). För att göra jämförelserna rättvisa måste jag skriva en artikel minst fem gånger så länge som den här, så så mycket som jag hatar att utesluta dem, måste jag utelämna de flesta produktjämförelser. För den mest uppenbara jämförelsen kan jag sammanfatta: AWS gör det mesta av vad Google gör, och är också mycket bra, men tar i allmänhet högre priser.

Google Cloud AI-byggstenar

Google Cloud AI-byggstenar är lättanvända komponenter som du kan integrera i dina egna applikationer för att lägga till syn, språk, konversation och strukturerad data. Många av AI-byggstenarna är förutbildade neurala nätverk, men kan anpassas med transferlärande och neuralt nätverkssökning om de inte tjänar dina behov direkt. AutoML-tabeller är lite annorlunda genom att den automatiserar den process som en datavetare skulle använda för att hitta den bästa maskininlärningsmodellen för en tabelluppsättning.

AutoML

Google Cloud AutoML-tjänsterna tillhandahåller anpassade djupa neurala nätverk för språkparöversättning, textklassificering, objektdetektering, bildklassificering och klassificering och spårning av videoobjekt. De kräver taggade data för träning, men kräver inte betydande kunskaper om djupinlärning, överföringsinlärning eller programmering.

Google Cloud AutoML anpassar Googles stridstestade djupneurala nätverk med hög noggrannhet för dina taggade data. I stället för att börja om från början när du tränar modeller från dina data, implementerar AutoML automatisk inlärning av djupöverföring (vilket innebär att den startar från ett befintligt djupt neurala nätverk utbildat på andra data) och neural arkitektursökning (vilket innebär att den hittar rätt kombination av extra nätverkslager ) för översättning av språkpar och andra tjänster som anges ovan.

Inom varje område har Google redan en eller flera förutbildade tjänster baserade på djupa neurala nätverk och stora uppsättningar märkta data. Dessa kan mycket väl fungera för dina uppgifter omodifierade, och du bör testa det för att spara tid och pengar. Om de inte gör vad du behöver, hjälper Google Cloud AutoML dig att skapa en modell som gör det, utan att du behöver veta hur du ska utföra överföringsinlärning eller hur man designar neurala nätverk.

Transfer learning erbjuder två stora fördelar jämfört med att träna ett neuralt nätverk från grunden. För det första kräver det mycket mindre data för träning, eftersom de flesta skikten i nätverket redan är välutbildade. För det andra tränar det mycket snabbare, eftersom det bara optimerar de slutliga lagren.

Medan Google Cloud AutoML-tjänsterna tidigare presenterades tillsammans som ett paket listas de nu med sina förutbildade bastjänster. Vad de flesta andra företag kallar AutoML utförs av Google Cloud AutoML-tabeller.

Läs hela recensionen av Google Cloud AutoML

AutoML-tabeller

Den vanliga datavetenskapsprocessen för många regression och klassificeringsproblem är att skapa en datatabell för träning, rengöra och konditionera data, utföra funktionsteknik och försöka träna alla lämpliga modeller på den transformerade tabellen, inklusive ett steg för att optimera de bästa modellernas hyperparametrar. Google Cloud AutoML-tabeller kan utföra hela processen automatiskt när du manuellt identifierar målfältet.

AutoML-tabeller söker automatiskt i Googles modellzoo efter strukturerad data för att hitta den bästa modellen för dina behov, allt från linjära / logistiska regressionsmodeller för enklare datamängder till avancerade djup-, ensemble- och arkitektursökningsmetoder för större, mer komplexa. Det automatiserar funktionsteknik på ett brett spektrum av tabelldata-primitiver - som siffror, klasser, strängar, tidsstämplar och listor - och hjälper dig att upptäcka och ta hand om saknade värden, outliers och andra vanliga dataproblem.

Dess kodlösa gränssnitt guidar dig genom hela livscykeln för maskininlärning från hela till slut, vilket gör det enkelt för alla i ditt team att bygga modeller och på ett tillförlitligt sätt integrera dem i bredare applikationer. AutoML-tabeller tillhandahåller omfattande inmatningsdata och förklaringsfunktioner för modellbeteenden, tillsammans med skyddsräcken för att förhindra vanliga misstag. AutoML-tabeller finns också i API- och notebook-miljöer.

AutoML-tabeller konkurrerar med Driverless AI och flera andra AutoML-implementeringar och ramar.

Vision API

Google Cloud Vision API är en förutbildad maskininlärningstjänst för att kategorisera bilder och extrahera olika funktioner. Det kan klassificera bilder i tusentals förutbildade kategorier, allt från generiska föremål och djur som finns i bilden (som en katt), till allmänna förhållanden (till exempel skymning), till specifika landmärken (Eiffeltornet, Grand Canyon), och identifiera bildens allmänna egenskaper, såsom dess dominerande färger. Det kan isolera områden som är ansikten och sedan applicera geometriska (ansiktsorientering och landmärken) och känslomässiga analyser på ansikten, även om det inte känner igen ansikten som tillhör specifika personer, förutom kändisar (som kräver en speciell användningslicens). Vision API använder OCR för att upptäcka text i bilder på mer än 50 språk och olika filtyper. Det kan också identifiera produktlogotyper och upptäcka vuxna,våldsamt och medicinskt innehåll.

Läs hela recensionen av Google Cloud Machine Learning API: er

Video Intelligence API

Google Cloud Video Intelligence API identifierar automatiskt mer än 20 000 objekt, platser och åtgärder i lagrad och direktuppspelad video. Det skiljer också scenändringar och extraherar rika metadata på video-, skott- eller bildnivå. Det utför dessutom textdetektering och extrahering med OCR, detekterar tydligt innehåll, automatiserar textning och textning, känner igen logotyper och upptäcker ansikten, personer och poser.

Google rekommenderar Video Intelligence API för att extrahera metadata för att indexera, organisera och söka i ditt videoinnehåll. Det kan transkribera videor och generera undertexter, samt flagga och filtrera olämpligt innehåll, allt mer kostnadseffektivt än mänskliga transkriberare. Användningsfall inkluderar innehållsmoderering, innehållsrekommendationer, mediearkiv och kontextuella annonser.

Natural Language API

Naturlig språkbehandling (NLP) är en stor del av den "hemliga såsen" som gör att input till Google Search och Google Assistant fungerar bra. Google Cloud Natural Language API exponerar samma teknik för dina program. Den kan utföra syntaxanalys (se bilden nedan), enhetsutvinning, sentimentanalys och innehållsklassificering på 10 språk. Du kan ange språket om du kan det. I annat fall försöker API: et att automatiskt upptäcka språket. Ett separat API, för närvarande tillgängligt för tidig åtkomst på begäran, specialiserar sig på hälso-relaterat innehåll.

Läs hela recensionen av Google Cloud Machine Learning API: er

Översättning

Google Cloud Translation API kan översätta över hundra språkpar, kan automatiskt upptäcka källspråket om du inte anger det och finns i tre smaker: Basic, Advanced och Media Translation. Advanced Translation API stöder en ordlista, batch-översättning och användningen av anpassade modeller. Basic Translation API är i huvudsak det som används av Google Translate-gränssnittet. AutoML-översättning låter dig träna anpassade modeller med hjälp av transfer learning.

API för Mediaöversättning översätter innehåll direkt från ljud (tal), antingen ljudfiler eller strömmar, på 12 språk och genererar automatiskt skiljetecken. Det finns separata modeller för ljud och video- och telefonsamtal.

Läs hela recensionen av Google Cloud Machine Learning API: er