Hlasové asistentky Alexa, Siri nebo Cortana se dostávají na stále vyšší úroveň. Nerozumí sice tak dobře mluvenému slovu jako lidé, ke špionáži však jejich schopnosti stačí.
Ve finále amerického Super Bowlu došlo k podivuhodné události. Když v televizní přestávce běžel reklamní spot, ve stovkách amerických domácností se probudilo k životu malé zařízení. V reklamě od Googlu totiž přístroje zaznamenaly klíčové slovo „OK, Google“, což aktivovalo rozpoznání řeči Smart Speakeru. Událost během několika minut rozvířila Twitter, poté následovala další on-line média. Stále více uživatelů Smart Speakeru tak napadá otázka: Čemu všemu domácí asistenti rozumí? Mohu být skutečně těmito přístroji odposloucháván?
Smart Speaker je nejmladší - a asi nejzajímavější - aplikace počítačového ovládání řečí. V roce 2011 integroval Apple asistentku Siri do operačního systému iPhonu, další hlasoví asistenti si našli cestu do milionů zařízení. Siri je k dispozici 700 milionům uživatelů iPhonu, 400 milionů může konverzovat s Google Assistant, dalších 400 milionů s Cortanou od Microsoftu. Ale teprve Alexa, instalovaná na Smart Speakery, vynesla tuto technologii do světel reflektorů.
Asistenti se proměnili na členy domácnosti, a to především na zahraničních trzích - v Německu, Británii či USA (pracují převážně s angličtinou a dalšími světovými jazyky). Ze Spojených států je známý případ, kdy Alexa naslouchala dění v domě, kde došlo k záhadnému úmrtí (viz box na protější straně). Objevují se nové otázky etické povahy: Jak tato zařízení skutečně fungují a čemu přesně naslouchají?
Bude pršet, Alexo?
Hlasoví asistenti velkých IT firem jsou výsledkem nového nasazení umělé inteligence - strojového učení pomocí hlubinných neuronových sítí. Jeho aplikace ve zpracování řeči sahá k přelomové práci z roku 1997, v níž Sepp Hochreiter z Mnichovské technické univerzity a Jürgen Schmidhuber ze švýcarské laboratoře IDSIA představili koncept tzv. long-term memory. Chyby ve zpracování vstupů jsou korigovány tím způsobem, že v neuronové síti vzniká určitý druh paměti, který uchová přes tisíc výpočetních kroků. Trvalo potom ještě asi patnáct let, než se tato aplikace stala standardní technologií - umožnil to silnější výkon, big data a cloud computing. Jde o to, umět analyzovat audiosignál slov, ale také rekonstruovat vzpomínku na předcházející rozhovory. Neurony v sítích jsou trénovány na enormní datové objemy, aby dokázaly porozumět větě, jako například „Bude dnes někdy pršet?“, kterou položí například uživatel na Manhattanu.
V prvním kroku je audiosignál věty převeden z neuronové sítě do počítače a přitom jsou odfiltrovány ruchy z pozadí. Druhým krokem je pak zpracování dialogu. Systém vypočítá, jak se má dialog vyvíjet dál. Musí následovat odpověď? Anebo má smysl protiotázka, není-li informace jednoznačná? Co je cílem dialogu? Na otázku o dešti musí systém najít předpověď počasí pro New York. Informace, že na Manhattanu kolem 16.30 bude s pravděpodobností 90 procent pršet, vstupuje do hry ve třetím kroku - generování řeči vytvoří odpověď: „Ano, dnes odpoledne od 16.30.“ Na této architektuře složené ze tří kroků jsou dnes postaveni všichni hlasoví asistenti.
Od pomocníka ke špionovi
Mají-li být zpracovány miliony otázek, nabízí se myšlenka použít pro to cloud - strojové učení na hlubinných neuronových sítích je na této platformě lépe škálovatelné. V roce 2020 bude celosvětově v praxi nasazeno 128 milionů přístrojů od Amazonu, na nichž funguje asistentka Alexa. Stále častěji jsou řečovým rozpoznáním vybaveny inteligentní termostaty, lampy či jiné aplikace chytrého domu. V tomto bodě to již začíná být ožehavé, protože z těchto dat je možné rekonstruovat zvyklosti obyvatel domu - jejich pracovní rytmus, záliby ve volném čase anebo vzorec, jak se pohybují v bytě. Společnosti Google či Amazon, které chtějí zavádět cílenou reklamu nebo vhodné produkty zaměřené na konkrétní skupiny zákazníků, taková data samozřejmě velmi zajímají. Není se co divit, že otázka ochrany dat nabývá na významu.
Mezi velkými poskytovateli hlasových asistentů a chytrých reproduktorů svoje data anonymizuje jenom Apple. Firma je totiž financována prodejem prémiových zařízení. Pro obchodní model Amazonu a Googlu by však takové anonymizování bylo smrtelné - obě společnosti totiž žijí z uživatelských dat.
Projekt Listen
Kdo používá Alexu nebo jiné asistenty bez anonymizace, musí se spoléhat na opatření pro datovou ochranu. Ta jsou v Evropě silnější než v USA. Zatímco od 25. května v Evropě platí opatření GDPR ve všech členských zemích, ve Spojených státech dosud neexistuje žádný samostatný zákon. Ochránci dat však nejsou s GDPR příliš spokojeni, protože jeho pravidla jsou podle nich příliš abstraktní a vzniká tak značná právní nejistota. Přinejmenším je však do GDPR vepsán princip „místa trhu“ - data podléhají pravidlům pro ochranu dat na místě, z něhož byla stažena. Jak je možné datovou ochranu vestavět přímo do systému, ukazuje projekt Listen pro inteligentní dům ovládaný hlasem. V něm se odehrává lokální rozpoznávání řeči. Chceteli pomocí řečového příkazu ovládat topení, zůstává tento dotaz na místě v domě. Otázky na počasí naproti tomu putují do cloudu, protože odpověď je možné najít v síti. Listen však posílá jenom abstraktní reprezentaci řeči, nikoli audiosignál samotný. Dodatečné informace, jako věk, pohlaví či emocionální vyladění uživatele se tak nedostanou do cizích rukou.
Čtyři kilogramy keksů
Pro všechny, kteří se zabývají ochranou dat, existuje záblesk naděje. Hlasoví asistenti nejsou zdaleka tak chytří, jak se mnozí domnívají. Zatímco deep learning znamenal přelom v rozpoznávání řeči, celá věc ztroskotává na jiné velké výzvě umělé inteligence - na tzv. celosvětových znalostech. Člověk jimi disponuje, takže ihned chápe, co se rozumí například slovem „klika“ - to může být jednak ovládání dveří, ale také hovorové vyjádření pro šťastnou náhodu. „Navzdory úsilí o to, vyvinout u digitálních systémů chápání kontextu, je výsledek jenom přibližně srovnatelný s tím, co zvládají lidé,“ uvedl Antonio Lieto z Univerzity v Turíně a jeho kolegové v článku z roku 2017. To objasňuje také to, proč lze na síti najít mnoho anekdot o tom, jak Alexa, Google Assistant nebo Siri někdy nechápou zcela správně. Hloupé je, mají-li tato nedorozumění další následky - například se tak stává, že Alexa objedná čtyři kilogramy keksů, protože šestileté dítě považovalo systém od Amazonu za kamaráda pro hraní. To, co se stalo v roce 2017 v Dallasu, je jistě k vzteku, ale stále ještě nejde o žádné drama.
Naproti tomu je problematické, že hlasoví asistenti naslouchají také v režimu stand-by. Americký advokát Gerald Sauer na to před časem upozornil v časopisu Wired: „Nejsou to přístroje, které potenciálně naslouchají. Jsou to přístroje, které naslouchají.“ Mohou-li být chytré reproduktory aktivovány pomocí slov jako „OK, Google“, musely předtím být jako jedno velké ucho. Tomu, že do cloudu nejsou posílány všechny audiosignály přicházející v režimu stand-by, můžeme věřit, ale také nemusíme.
***
Vražda, nebo nešťastná náhoda?
Příběh, v němž hrají hlavní roli digitální asistenti, se odehrál v americkém městě Bentonville ve státě Arkansas. Místní občan James Bates (na fotografii) měl v domě nainstalovaný systém Amazon Echo s asistentkou Alexou. Bates si k sobě pozval svého známého, policistu Collinse. Večer se společně dívali na fotbal a popíjeli vodku a pivo, Collins se potom šel vykoupat do vířivky napuštěné horkou vodou. Majitel domu později vypověděl, že když se ráno vzbudil, našel Collinse ve vířivce mrtvého. Podle Batese šlo o tragickou nehodu, jejíž příčinou byl především alkohol. Vyšetřovatelé mu ale nevěřili, domnívali se, že Collinse nejprve někdo škrtil, teprve pak se ve vířivce utopil. Proto si od výrobce zařízení, společnosti Amazon, vyžádali zvukovou stopu ze systému Echo, která by mohla poskytnout klíčový důkaz. Bates byl ale nakonec žaloby sproštěn, Alexa se protentokrát korunním svědkem nestala.
Foto popis| Pomocí aplikace za dva dolary lze spustit asistentku Alexu také na zařízení Apple Watch.
Foto popis| Jméno asistentky Cortana je odvozeno od fiktivní postavy ze série her Halo.
Foto popis| Prodeje zařízení HomePod zatím nelze považovat za úspěch společnosti Apple.
O autorovi| MICHAL ČERNÝ, michalcerny.media@seznam.cz