Výpočetního výkonu není nikdy dost. Nová generace superpočítačů by však brzy měla tento problém vyřešit. Jsme na začátku éry exaskalárních superpočítačů s výkonem v řádu exaFLOPS.
Závod o zprovoznění prvního exascale superpočítače byl odstartován. V příštích pěti letech bude patrně uveden do provozu v Číně, USA i Japonsku počítač s výpočetní silou trilion (tedy 10 na 18) operací v pohyblivé řádové čárce za sekundu, pro což se používá zkratka exaFLOPS (Floatingpoint Operations Per Second). Jde o obvyklé měřítko výkonností počítačů. Jedná se o technologickou výzvu, která si vyžádá přehodnocení některých doposud používaných postupů. Kromě klasického výpočetního klastru HPC (High-performance computing) budou muset počítače nové generace využít i big data a strojové učení. Právě z toho důvodu exascale počítače potřebují nejen nový hardware i software na úrovni exa, ale také nové přístupy při práci s výpočetními prostředky a jejich výsledky.
Potřeba další výpočetní síly vychází z toho, v jakém světě žijeme. Svět se totiž pro nás stává stále složitějším a můžeme ho pochopit a ovládat jen za mechanické pomoci. Superpočítače se ale stávají i základem národních ekonomických a bezpečnostních strategií. Země jako Čína, ale i Japonsko a v poslední době i Evropa se snaží o svoji nezávislost na americkém křemíku a chtějí mít své vlastní výpočetní zdroje na co nejvyšší úrovni. Závod o první exaskalární počítač je tedy více než akumulace procesorových jader, GPU, pevných disků a operační paměti. Je to skok do exaskalární éry.
Počítač, který je prostě super
Některé výzkumné a ekonomické obory už zkrátka nemohou jednoduše bez superpočítačů existovat: „Simulace v nejširším smyslu, například numerická aproximace fyzikálních zákonů, se stala kromě teorie a experimentu ‚třetím základním kamenem věd‘,“ říká k tomu Dorian Krause, vedoucí oddělení High-Performance Systems v Jülichově superpočítačovém centru. Od fyziky po složité sociální systémy lze vše simulovat. Vyšší výpočetní výkon pak zajistí vyšší přesnost, možnost lepšího rozpoznání a eliminování vlivu chyb a díky tomu se zvýší prediktivní výkon. Kromě vědy je další hnací silou požadující vyšší výkon průmysl. Zde lze tento výkon využít například při průzkumech ložisek ropy a zemního plynu za pomoci seizmických simulací, při vývoji nových léčiv, při optimalizaci vývoje automobilů a letadel, jakož i při optimalizaci řetězce dodavatelů.
Počítač jako zbraň
Dokonce i armáda, dlouholetý a autonomní producent obrovského množství dat, používá superpočítače: pro dešifrování, vývoj a testování nových zbraňových systémů a simulaci jaderných zbraní a výbuchů. To, co se ale stává stále důležitějším, je hodnota simulací pro rozhodování. Například americký program pro modernizaci (American High Performance Computing Modernization Program – HPCMP) sám stanovil dvanáct výzkumných oblastí, v nichž budou superpočítače pro armádu užitečné, včetně simulace chování vojáků založené na skutečných datech z bojiště. Vzhledem k tomu, že válku plánují, a možná i někdy rozhodují počítače, výpočetní síla je věcí národní obrany a schopnosti útočit. Proto i další země začínají používat počítač jako zbraň. Jako příklad je možné uvést superpočítač NDMC s výkonem 16 petaFLOPS, který uvedla do provozu ruská armáda v roce 2016. Předpokládá se, že kromě jiného ho využívá pro odhad výsledků konfliktů. Není tedy divu, že supermocnosti, zejména USA a Čína, vedou exaskalární závod. A v tuto chvíli to vypadá, že by mohli zvítězit Číňané. V květnu debutovali prototypem svého dalšího superpočítače Tianhe-3 na světovém kongresu World Intelligence Congress v Tchien-ťinu. Ten má být uveden do provozu v roce 2020 a mělo by jít o první exascale počítač na světě. Američané však plánují Čínu o rok později dohnat superpočítačem Aurora 21, prvním exascale systémem v USA. Do plného provozu by měl být uveden v roce 2022.
Exascale prostě symbolizuje prestiž, moc a demonstruje svrchovanost. Například USA se pokusily zabránit čínským simulacím jaderných zbraní v roce 2015 embargem na některé čipy od Intelu. Číňané na to zareagovali vývojem vlastního procesoru pro superpočítače a jejich superpočítač Sunway TaihuLight nakonec skončil v žebříčku nejvýkonnějších počítačů TOP 500 jako nejrychlejší na světě (a to podle zpráv médií v počáteční fázi ještě nefungoval na plný výkon). Dokonce i Japonsko, které má v oblasti superpočítačů velmi dobrou pozici, se snaží o nezávislost na zahraničních komponentách a vyvíjí vlastní hardware. Za tímto účelem vyvinula společnost Fujitsu a státem vlastněný výzkumný ústav RIKEN vlastní procesor s architekturou ARM, od něhož se očekává, že se stane základem superpočítače Post-K, který by měl fungovat už v roce 2021.
Import výpočetního výkonu
Superpočítače poskytují státům výhody nejen v oblasti výzkumu a vývoje, ale mají i své strategické výhody v oblasti bezpečnosti. „Superpočítače jsou jádrem nejdůležitějšího vývoje a inovací,“ uvádí se ve zprávě EU z roku 2018, hodnotící jejich dopad. „Ten, kdo disponuje nejmocnějším výpočetním výkonem, překonává ty druhé v konkurenčním boji. Superpočítače jsou nenahraditelnou technologií pro formování politiky a pro zajištění národní svrchovanosti, pro podporu strategických rozhodnutí v oblasti energetiky, vnitřní bezpečnosti a klimatu a v souvislosti se zajištěním národní bezpečnosti.“
Z tohoto pohledu však EU silná není: „Evropa dnes spotřebovává zhruba 29 procent celosvětových výpočetních zdrojů HPC, ale poskytuje jich přibližně jen 5 procent.“ A zhruba jen každý pátý evropský superpočítač je evropskou firmou vyráběn. Cíl by měl být tedy jasný: evropský exascale počítač s evropským hardwarem a softwarem. Aby to bylo možné, zahájila Evropská komise v lednu 2018 iniciativu EuroHPC pro vysokovýkonné počítače, přičemž rozpočet by měl činit zhruba miliardu eur na nákup několika počítačů s výkonem 100 petaFLOPS, na vývoj počítače s výkonem exaFLOPS a dvou procesorů pro superpočítače, které by měly být mimořádně energeticky úsporné, protože elektřina je v Evropě několikanásobně dražší než v USA nebo Číně.
Klenot od Jülicha
Dokonce i ekonomicky vyspělé Německo hraje v oblasti superpočítačů z TOP 500 jen sekundární roli. Všechny německé systémy dohromady by se sotva dostaly do první desítky (stávající jednička z TOP 500, počítač Summit, postavený IBM pro Oak Ridge National Laboratory, má výkon 122 petaFLOPS a za určitých okolností je schopen překročit hranici 1 exaFLOPS). Ani v nejbližší budoucnosti se v tomto směru nic nezlepší. Pokud v říjnu tohoto roku dojde v Mnichově ke spuštění superpočítače SuperMUC-NG, bude v nejlepším případě dosahovat výkonu 26,7 petaFLOPS. Do té doby bude nejvýkonnějším německým počítačem systém Juwels z Jülichu s teoretickým špičkovým výkonem až 12 petaFLOPS (současný nejrychlejší český superpočítač Salomon má výkon 2 petaFLOPS).
Ale Juwels se ani neměl stát přeborníkem v benchmarcích. Má totiž připravit Německo i celou Evropu na snadnější přechod do exaskalárního věku. Bude se na něm testovat nový modulární design, který by mohl sloužit i pro exaskalární výpočetní systémy v EU. Hranice mezi tradičními úlohami superpočítačů, mezi které patří modelování a simulace, big data a strojové učení, se v poslední době rozvolňují. Nové exascale systémy by tyto úlohy měly bez problémů zvládnout: musí totiž rychle provádět masivně paralelní výpočty, přemisťovat ohromná množství dat a navíc urychlovat neuronové sítě. A nejde přitom jen střídat jeden úkol za druhým. Stále častěji budou totiž všechny úlohy propojeny. Například při simulacích se využijí big data, která byla zpracována pomocí algoritmů strojového učení. Juwels tak bude brzy přebudován na zrychlovací modul pro masivně paralelní aplikace, což povede ke zvýšení jeho výkonu.
Dorian Krause, který je zodpovědný za provoz superpočítače Juwels, se ale nedomnívá, že by Německo a Evropa výrazně zaostávaly v oblasti superpočítačů: „Je zde silná vědecká komunita s vysokou odborností v oblasti vývoje aplikací a vývoje HPC.“ Německo bude v nejbližších letech neustále rozšiřovat svou celkovou výpočetní sílu. V současné době je celkový výkon asi 25 petaFLOPS, na podzim už by to mělo být 45. Při diskusi o exaskalárních superpočítačích nesmíme zapomínat na to, že takovýto stroj by byl Pyrrhovým vítězstvím, pokud by se nenašel odpovídající počet uživatelů. Stejně jako v případě osobních počítačů je nesmírně drahé vybudovat první stroj, který zvítězí v nějakém benchmarku. A stejně tak klesají i jeho ceny. První exascale superpočítače budou stát stovky milionů eur a upgrade superpočítačů desítky milionů.
Zatím však superpočítač Juwels stále spoléhá na hardware vyrobený převážně v USA – na procesory od Intelu, grafické karty od Nvidie a infrastrukturu od Mellanoxu. I tak se může stát základem evropského superpočítače s evropskými hardwarovými komponentami. V březnu roku 2018 spustila Evropská komise evropskou iniciativu EPI (European Processor Initiative) jako součást zmíněné EuroHPC. Podle ní by se v Evropě měly vyvinout dva procesory – standardní vysoce výkonné CPU založené na architektuře ARM a koprocesor založený na RISC-V, který bude možné využít v superpočítačích, výpočetních centrech, ale i v automobilovém průmyslu. Předpokládá se, že by se mohl začít vyrábět do roku 2021 a připraví se tak základ pro vývoj prvního exaskalárního superpočítače budovaného v letech 2023 až 2024.
Cílem je tedy evropský exascale superpočítač s evropským hardwarem a softwarem. EU zatím financuje tento projekt částkou 120 milionů eur, ke které přispějí zatím neznámou sumou i partneři projektu, kterých je 23 a patří k nim i francouzská superpočítačová společnost Atom, která buduje i Juwels. Evropská komise dále rozšiřuje iniciativu týkající se cloudu z roku 2016 a přidává miliardu eur na vývoj „kvantových technologií“, kam patří i superpočítače. Blížíme se tedy technologickými skoky…
Kvantové a mozkové stavy
Přestože se v posledních letech vyvíjejí různé superpočítače především za použití klastrů, existují už poměrně dlouhou dobu i zcela nové přístupy, tedy především kvantové počítače a neuromorfní počítače. „Tyto typy ale nejsou připraveny pro výrobu,“ říká odborník na superpočítače Dorian Krause, „v budoucnosti by však mohly být využity pro speciální úkoly.“ Kvantové počítače jsou zatím tak trochu sci-fi, ale s kvantovými annealery D-Wave od Fujitsu lze urychlit konkrétní optimalizační úkoly. Pro strojové učení jsou optimalizované tzv. neuromorfní čipy, jako je čip BrainScaleS z projektu Human Brain Project, kdy se neuronové struktury přenáší na křemík. Na těchto procesorech mohou být neuronové sítě provozovány obzvláště rychle a energeticky účinně.
Avšak bez ohledu na to, jak výkonné superpočítače jednoho dne budou, jejich výpočetní síla nebude stačit. Jedním z řešení tak bude jejich vzájemné propojení. Zpráva mezinárodního týmu Big Data and Extreme-scale Computing (BDEC) navrhuje, aby se superpočítače připojovaly přes rozbočovače do rozsáhlé sítě výpočetních zdrojů potřebných pro „zpracování a výzkum datových toků z více zdrojů“. Všechno bude propojeno v této obrovské síti – od superpočítače na jednom konci až po snímací čip internetu věcí na straně druhé. Ve srovnání s vývojem vysoce koncentrované výpočetní síly je to ještě obtížnější úkol. Podle BDEC proto musí být převládající internetové paradigma přehodnoceno a musí se nově zkombinovat různé formy zpracování, skladování a dopravy dat. Tato nová „síť pro zpracování dat“ by měla být „integrovanější než všechno, co bylo doposud k dispozici“. Autoři zprávy BDEC sice nepochybují, že tento závazek bude složitý, ale lidé mu musí čelit – lidstvo už jednou internet vynalezlo. Jak by to vypadalo, kdyby se o něco takového pokusilo znovu a vytvořilo opravdu obrovský superpočítač, který by dokázal odpovědět i na ty nejsložitější otázky?
Nejrychlejší: Summit (OLCF-4)
Summit je jeden ze dvou superpočítačů provozovaných americkým ministerstvem energetiky. Začal se stavět na konci roku 2014 a stál celkem 325 milionů dolarů. Summit je používán pro civilní výzkum. Jeho sourozenec Sierra (stále ve výstavbě) by pak měl sloužit k simulaci jaderných výbuchů. Během uvedení do provozu v červnu roku 2018 dosáhl Summit výkonu 122,3 petaFLOPS v benchmarku Linpack a po dvou letech tak dostal v žebříčku nejvýkonnějších počítačů TOP 500 do vedení Spojené státy. Předtím byl v čele čínský superpočítač Sunway TaihuLight (93 petaFLOPS). V čele ale nebude dlouho – Čína i Japonsko by ho měly brzy překonat.
Benchmark Linpack 122,3 Petaflops Maximální výkon 200 Petaflops Počet jader CPU 2,28 mil. Počet GPU 27 648 Počet výpočetních uzlů 4 608 Úložiště 250 PB
Hmotnost 340 tun Rozměry 520 m2 Délka kabelů 298 km Spotřeba 13 MW Spotřeba vody 15 142 l/min Energetická účinnost 13,9 GFlops/W
Limity růstu výkonu Do června 2018 rostl výkon superpočítačů rychleji než podle Moorova zákona. Od té doby jsou ale mnohem pomalejší.
Dominance jednoho procenta Podíl pěti nejrychlejších superpočítačů na světě na celkovém výpočetním výkonu všech známých superpočítačů: od roku 2011/2012 byl hodně vysoký, od roku 2018 se však místně snižuje. Efektivnější vodní chlazení Superpočítač Juwels je chlazen bez chladicích jednotek pomocí výměny vody za využití okolního vzduchu. To umožňuje téměř ideální stupeň účinnosti 1,12 wattu investované energie za watt výpočetního výkonu. Na obrázku je server Lenovo SD650 z mnichovského superpočítače MUC-NG s přípojkami na vodu, které používá i Juwels.
Juwels Module 1
Juwels (Jülich Wizard for European Leadership Science) je v současnosti nejrychlejší německý a 23. celkově superpočítač – dokud nebude uveden do provozu SuperMUC-NG, k čemuž má dojít v lednu 2019. SuperMUC Phase 2 by měl mít maximální výkon 26,9 petaflops. Ovšem
Juwels Module 1 je jen začátek: přepokládá se, že do roku 2020 bude rozšířen o přídavný modul pro zvláště složité výpočty a měl by tak dosáhnout dvou až čtyřnásobného výkonu. Se svou modulární koncepcí je Juwels vzorem pro exaskalární budoucnost EU.
Hardware 10 BullSequana X1000 od firmy Atos První benchmark Linpack 6,18 Petaflops Maximální výkon 12 Petaflops z toho 1,6 Petaflops na GPU Počet jader CPU 120 528 Intel Xeon, 24Core Skylake Počet GPU 192 Nvidia V100
Počet výpočetních uzlů 2 559 Operační paměť 264 TB Rozměry 75 m2 Spotřeba 1,36 MW Teplota vody do 40 °C Energetická účinnost 4,5 GFlops/W Neuromorfní čip: BrainScaleS Neuronové struktury se přenesou na křemík a mohou urychlit strojové učení a výrazně ho vylepšit.
Foto popis| Letadla a vozidla jsou aerodynamicky optimalizována pomocí simulace proudění. Menší odpor = méně paliva.
Foto popis| Analýza vzorků DNA je výpočetně náročná. Jasný úkol pro superpočítače.
Foto popis| Výpočet budoucnosti: Pouze superpočítače mohou simulovat složité plazmové toky v jaderných reaktorech.
O autorovi| FELIX KNOKE, autor@chip.cz