Strojové učení umožňuje algoritmům předpovědět vývoj chaotických systémů. Dobrá zpráva pro meteorology, lékaře a zásobování energií pomocí globálních zdrojů.
Chaos - neoddělitelný, nevyzpytatelný roj bez pravidel. Popis těchto nahodilých změn, poklesů a přechodů se zdá nemožný. Zvláště od doby, kdy průkopníci teorie chaosu objevili před padesáti lety motýlí efekt. Dokonce i nejmenší narušení komplexního systému (jako je počasí, ekonomika nebo jednoduše cokoli jiného) může vyvolat řetězec událostí vedoucí k dramatické změně. Jelikož nemůžeme určit stav těchto systémů natolik přesně, abychom mohli předpovídat jejich další vývoj, žijeme tak řečeno pod závojem nejistoty. Nyní vědci zabývající se strojovým učením - technologií, která stojí za nejnovějšími pokroky v oblasti umělé inteligence (AI) - představili neuvěřitelně dalekosáhlé předpovědi, co se týče vývoje chaotických systémů od daného okamžiku.
Odpovídající výsledky pocházejí od teoretika chaosu Edwarda Otta a jeho čtyř spolupracovníků z Marylandské univerzity. Použili algoritmus strojového učení nazvaný reservoir computing, aby si „osvojili“ dynamiku typického chaotického systému nazvaného Kuramotova-Sivashinského rovnice. Tato rovnice slouží jako „zkušební standard pro zkoumání turbulence a časoprostorového chaosu“, jak to nazývá Jaideep Pathak, Ottův doktorand a hlavní autor nové práce. Ve vizualizaci se chová jako plamen, který bliká, když proniká do hořlavého média. Časové období, během něhož je možné provést smysluplné předpovědi o chování systému, se matematicky označuje jako Ljapunovův čas.
Data namísto rovnic
Poté, co byl algoritmus vyškolen pomocí údajů z minulého vývoje Kuramotovy-Sivashinského rovnice, bylo možné tento Ljapunovův čas prodloužit osmkrát. „To je skutečné skvělé,“ říká o Ljapunovově časové předpovědi Holger Kantz, teoretik chaosu z Institutu Maxe Plancka pro fyziku komplexních systémů v Drážďanech. „Technika strojového učení je téměř tak dobrá jako znalost samotné pravdy.“ Algoritmus přitom sám neví vůbec nic o faktorech, jako je KuramotovaSivashinského rovnice, které určují vývoj. Zpracovává pouze data o vyvíjejícím se řešení těchto rámcových podmínek. Právě to dělá tuto verzi AI tak silnou, protože v mnoha případech nejsou rovnice popisující chaotický systém vůbec známy. Ottovy výsledky naznačují jednoduchý závěr: není třeba žádné rovnice, stačí pouze data. „Možná bychom mohli jednoho dne předpovídat počasí pomocí algoritmů strojového učení, a ne sofistikovanými modely atmosféry,“ říká Kantz.
Obvyklým přístupem pro předpovídání chaotického systému je co nejpřesněji měřit jeho podmínky v daném okamžiku, použít tato data ke kalibraci fyzikálního modelu a poté tento model dále upravit. Hrubým odhadem by člověk musel měřit výchozí podmínky typického systému 100milionkrát přesněji, aby předpověděl jeho budoucí vývoj osmkrát dále. Ve svém článku, publikovaném letos v lednu v Physical Review Letters (PRL), výzkumníci ukazují, že jejich předpovězené řešení typu plamenu pro Kuramotovu-Sivashinského rovnici přesně odpovídá správnému řešení, dokud chaos po osmi Ljapunovových časech konečně nevyhraje. Teprve od tohoto okamžiku se skutečné stavy systému začnou odchylovat od těch předpokládaných.
Váleček na nudle jako princip chaosu
Délka Ljapunovova času se pro různé systémy liší, od milisekund, např. při nějaké explozi, až po miliony let u kontinentálního driftu. Čím kratší je, tím je systém citlivější nebo náchylnější na motýlí efekt, neboť podobné situace se rychleji rozvíjejí směrem k nerovnosti. V přírodě se chaotické systémy vyskytují všude a všechny se vyvíjejí různou rychlostí. Je zvláštní, že samotný chaos je obtížné popsat. „Je to termín, který většina lidí používá ve svém každodenním životě, aniž by znala jeho přesný význam,“ vysvětluje Amie Wilkinsonová, profesorka matematiky na Chicagské univerzitě.
Wilkinsonová a Kantz definují chaos ve smyslu linií a vrásek, které vznikají při opakovaném protahování a skládání listového těsta při jeho hnětení nebo válení. Každý kus těsta se horizontálně roztahuje pod válečkem a odděluje se exponenciálně rychle ve dvou směrech. Pak je těsto složeno a zploštěno, přičemž sousední místa jsou stlačena ve svislém směru. Počasí, lesní požáry, povrch slunce a všechny ostatní chaotické systémy fungují právě tak, vysvětluje Kantz. „Abychom dosáhli exponenciální odchylky pohybových křivek, potřebujeme toto natahování, a abychom nekončili v nekonečnu, potřebujeme naopak skládání.“
Algoritmus vytváří vlastní vzorce
Protahování a komprese v různých rozměrech odpovídá (v matematické češtině) kladným a záporným Ljapunovovým exponentům systému. V jiném nedávno publikovaném článku Marylandský tým informoval, že jeho reservoir computing se může úspěšně naučit hodnoty těchto exponentů z údajů o vývoji systému. Proč je reservoir computing tak dobrý v určování dynamiky chaotických systémů, ještě není úplně jasné. Počítač možná zvládá v odezvě na zachycená data vyladit vlastní vzorce tak, až odpovídají dynamice systému a předvídají jeho průběh.
Strojové učení je proto „velmi užitečný a silný přístup“, vysvětluje Ulrich Parlitz z Institutu Maxe Plancka pro dynamiku a sebeorganizaci v německém Göttingenu, který na počátku roku 2000 také uplatnil strojové učení na méněrozměrových chaotických systémech. „Myslím, že to nefunguje pouze na prezentovaném příkladu, ale je v jistém smyslu univerzální a může být použito v mnoha procesech a systémech.“ Parlitz tak předpověděl využívání reservoir computingu ke kontrole dynamiky „stimulovatelných médií“, jako je například srdeční tkáň. Parlitz se domnívá, že využití hloubkového učení ke zlepšení umělých neuronových sítí je sice složitější a náročnější na výpočetní techniku než reservoir computing, ale i to je pro zvládnutí chaosu vhodné.
Ott, Pathak, Girvan, Lu a další výzkumníci se od zveřejnění svého článku v PRL opět přiblížili k zavedení své prediktivní technologie do praxe. V nových výzkumech vědci ukázali, že zlepšené předpovědi chaotických systémů, jako je například Kuramotova-Sivashinského rovnice, jsou umožněny kombinováním strojového učení řízeného daty a tradiční předpovědi vycházející z modelování. Pro Otta to otevírá pravděpodobnější způsob, jak zlepšit prognózu počasí a podobné snahy. Koneckonců pro žádný scénář neexistují úplná přesná data ani perfektní fyzikální modely. „Měli bychom využít dobré znalosti, které jsou momentálně k dispozici,“ říká, „a když něco nevíme, měli bychom použít strojové učení a snažit se tyto mezery nevědomosti zaplnit.“ Předpovědi reservoir computingu mohou pomoci ještě více vylepšit prediktivní modely. V případě KuramotovySivashinského rovnice by přesné předpovědi mohly být dokonce rozšířeny až na 12násobek Ljapunovova času.
Vhodná nejen pro předpovědi počasí
Metoda analýzy používaná Ottovým týmem by mohla pomoci nejen při předpovědích počasí, ale také při sledování srdečních arytmií jako známky blížícího se srdečního infarktu nebo při hlídání vzorů neuronových vzruchů v mozku, reagujících na změny v neuronových špičkách. Je také možné, že lze předpovědět vznik obřích vln v oceánu (které se už staly osudnými pro mnoho lodí) nebo zemětřesení. Jiným myslitelným kandidátem by mohlo být magnetické pole, které má udržovat pohyb plazmy ve fúzních reaktorech Tokamak. Ott především doufá, že jeho nástroj se ukáže jako užitečný při varování před hrozivými slunečními bouřemi. Taková událost způsobí narušení magnetického pole Slunce a následně vyvolá silný rentgenový záblesk. To vede k vzedmutí velkého plazmového mraku, který by dosáhl na Zemi asi po dvou dnech. Pokud by taková sluneční bouře dnes zasáhla naši planetu, mohlo by to vážně poškodit pozemní elektronickou infrastrukturu. Proti tomu by měl Ott jednoduchou pomoc: „Pokud víte, že přichází bouře, jednoduše vypnete napájení a později ho znovu zapnete.“
***
Co je to reservoir computing?
Neuronové sítě jsou navrženy tak, aby zkoumaly velké množství dat v krátkém čase a získaly z něho důležité informace. Jsou využívány například pro rozpoznávání obličeje, při převodu mluvené řeči na text nebo při jejím překladu. Ve všech těchto oblastech je důležitý kontext příslušných dat. Díky opakujícím se smyčkám získává síť paměť, která pak umožňuje určovat smyslový kontext. Proces vytváření takové paměti v neuronové síti je časově náročný a nákladný. Nasazení reservoir computingu inspirované neuronovými sítěmi a výzkumem mozku dramaticky zkracuje dobu učení neuronových sítí. Koncept se opírá o složitost nelineárních přechodových odpovědí, tj. opakování v dynamických systémech vyvolané signály, které představují problém, jenž se má vypočítat. Systém reservoir computingu je třeba iniciovat pouze jednou, poté se výukové schopnosti neuronové sítě vyvíjejí samy.
***
Co je to Ljapunovův čas?
Ljapunovův exponent dynamického systému (podle Alexandera Michajloviče Ljapunova) popisuje rychlost, s jakou se dva blízko sebe ležící body ve fázovém prostoru (množině všech možných stavů dynamického systému) vzájemně vzdalují nebo přibližují. Vezmeme-li v úvahu obecné průběhy křivek řešení, pak právě exponenty poskytují měřítko pro míru rychlosti oddělení od původní křivky. Jako Ljapunovův čas je označováno časové období, pro které lze provést rozumné předpovědi o chování systému. Termín se váže k ruskému matematikovi a fyzikovi Alexandrovi Michajlovičovi Ljapunovovi (1857-1918). Ljapunov se už od počátku své kariéry zabýval otázkami stability a rovnováhy dynamických systémů. Učil jako profesor v Charkově a v Petrohradě, přednášel o diferenciálních rovnicích a teorii pravděpodobnosti.
Foto popis| Jaideep Pathak, Michelle Girvan, Brian Hunt a Edward Ott z Marylandské univerzity. Vědci ukázali, že strojové učení je silným nástrojem pro předpovědi chaosu.
Foto popis| Jak AI krotí chaos 1 Vizualizace Kuramotovy-Sivashinského rovnice pro pohyb plamene. 2 Algoritmus počítá další vývoj. 3 Odčítání 2 od 1 ukazuje, že algoritmus velmi dobře popisuje model po osm Ljapunovových časů - až poté opět vítězí chaos.
Foto popis| Ljapunovův exponent
Foto popis| Kuramotova-Sivashinského rovnice je nelineární parciální diferenciální rovnice pro modelování nestability laminárního plamene. Slouží jako zkušební standard pro zkoumání turbulence a časoprostorového chaosu.
Foto popis| EKG Monitorováním srdečních arytmií by mohly být včas detekovány hrozící infarkty.
Foto popis| Mraky Předpověď počasí by se mohla bez velkého úsilí provádět na mnohem delší dobu.
O autorovi| RICHARD MEUSERS VON WISSMANN, autor@chip.cz