Google len prednedávnom predstavil nové API. Ide hlavne o vylepšenie možností analýzy dát z obrázkov, videí alebo textu. Tie otvárajú nové obzory v analýze dát.

Google Vision API

DEMO 
Táto API nám poskytuje veľkú silu, nakoľko pomerne jednoducho dokáže analyzovať obrázky a dôležité informácie získané z nich.
Pri jej teste som do nej nahral obrázok odfotený z vrcholu Eiffelovej veže.
Google Vision API určila, presne odkiaľ bol obrázok odfotený, spolu s GPS súradnicami miesta. V mojom prípade Google Visual API správne identifikovala miesto ako Paríž, konkrétne Eiffelovu vežu.

Ďalej bol obrázok zaradený do kategórií s pravdepodobnosťou, s akou si je API istá, že je výsledok správny. Tieto kategórie nám môžu pomôcť pri analýze veľkého množstva obrázkov a zistiť, ktoré z nich sú napríklad najzdieľanejšie. Prípadne vedia zistiť či existuje nejaká kategória, ktorá ich spája. V mojom prípade bol obrázok zaradený do týchto kategórií:

Ďalej dokáže API vyhodnotiť, či sa na internete nachádzajú podobné obrázky a tiež určí, čo sa na obrázku nachádza. Pre mnou nahraný obrázok to boli:

Google Visual API tiež dokáže vyhodnotiť, či je obsah obrázka vhodný pre deti alebo neobsahuje násilie.

Ak napríklad do tejto API vložíte obrázok tváre, dokáže vyhodnotiť aj momentálne emócie človeka na obrázku. Ak obrázok obsahuje text, API dokáže tento text identifikovať a prečítať.

Ako je to využiteľné?

Predstavte si že máme blog, kam môžu prispievať všetci registrovaní používatelia. Môžu písať články a môžu k nim pridať aj svoje vlastné fotografie. Pomocou Google Visual API môžeme analyzovať obrázky z pohľadu licencie CC – či ide o originálny obrázok autora, alebo bol stiahnutý z Googlu s možným porušením autorských práv.
Rovnako možno analyzovať nevhodný obsah. Takto sa môžeme vyhnúť pokutám, prípadne zníženiu nášho renomé.

Môžeme si taktiež všímať aj to, čo sa na daných obrázkoch nachádza a zaradiť tieto objekty do kategórií. Môžeme zistiť, že určité kategórie obrázkov majú väčší vplyv na návštevníkov web stránky ako iné kategórie.

Google Natural Language API

DEMO
Google Natural Language API sa zaoberá textami. Analyzuje vzťahy medzi slovami, a každému slovu v texte priradí váhu.
Najlepšie je to opäť vysvetliť na príklade.

Skopíroval som si text a vložil ho do API. Po chvíli som mal pred sebou výsledok:

Natural Language API zanalyzovala text a mohol som vidieť slová, ich dôležitosť a kategórie, prípadne entity, kam slová patria. Ak ste niekedy počuli o textovej vate, tak na hornom obrázku je táto „vata” zobrazená sivou farbou. Dá sa povedať, že analýza určila dôležitosť a relevanciu jednotlivých slov.

Zaujímavým je aj hodnotenie sentimentality textu, teda toho, akú náladu môže text vyvolať u čitateľa. To je vyjadrené indexom na škále od -1 (veľmi negatívne) po 1 (veľmi pozitívne).


Ako je to využiteľné?

Možno analyzovať celé blogové články, popisy predávaných produktov a ako silne vplývajú na používateľa. To sa môže osvedčiť napríklad pri identifikácii hoaxov.
Rovnako s pomocou Natural Language API možno vnímať súvislosti a lepšie analyzovať obsah dlhých textov. Táto API dokáže generovať kľúčové slová pre články a rovnako dokáže určiť, ktorý text je len „veľa slov a málo kontextu”, a ktorý text je, naopak, hutný a kvalitný.

Google Video Intelligence API

DEMO
Veľmi podobná ako Google Vision API je i Video Intelligence API.
Dokáže rozoznať prvky z videa, časy, v ktorých sa dané prvky vo videu nachádzajú, ako i pravdepodobnosť, s akou si je API istá, že sa nemýli.

Tiež dokáže určiť, kde bolo video nasnímané.

Ako je to využiteľné?

Predstavte si, že máme blog, kam môžu prispievať všetci registrovaní používatelia. Môžu písať články, avšak rovnako môžu pridávať aj svoje vlastné videá. Pomocou Google Video Intelligence API skontrolujeme, či nie je obsah videa nevhodný.

Dokážeme tiež analyzovať to, čo sa na všetkých videách nachádza a ich početnosť. Ak niekto vo videu rozpráva, vieme určiť, v ktorom čase sa tak deje. Taktiež vieme vyextrahovať, kto čo hovorí. Teda môžeme analyzovať video z pohľadu obsahu, ako aj z pohľadu objektov a farieb.

Predstavte si, že na vašej stránke sú stovky rôznych blogových videí. Ako správca webu nemáte šancu všetky tieto videá pozerať a vyhodnotiť. Avšak pomocou analýzy a štatistiky dokážete presne zistiť, čo sa na vašej stránke nachádza. Keď viete, čo obsahujú videá na vašom webe , poznáte aj to, aké témy sú zaujímavé pre vaše publikum.

No a keď lepšie poznáte vaše publikum, dokážete mu ponúknuť relevantnejšie služby.

Technický výstup

Dáta z nových Google API treba pred analýzou spracovať. Tieto dáta sú vo formáte JSON, ktorý je ľahko prístupný pre ďalšiu dátovú analytiku napríklad v Pythone, R alebo REST API.

Záleží len na Vás, ktorý nástroj preferujete.

Isto je ešte veľa iných možností na využitie týchto API. Ešte viac zaujímavými sa stávajú, keď sa spoja viaceré z nich do jedného produktu.

Nové Google API pohromade:

Video Intelligence API: https://cloud.google.com/video-intelligence/
Vision API: https://cloud.google.com/vision/
Speech API: https://cloud.google.com/speech/
Natural language API: https://cloud.google.com/natural-language/
Translate API: https://cloud.google.com/translate/