Přejít k hlavnímu obsahu

Silvermont: úsporný Atom

Výkon procesorů Intel se pravidelně zvyšuje podle Moorova zákona. Nová generace Atom Silvermont má být navíc výrazně úspornější.

JÖRG GEIGER, MICHAL BAREŠ

Procesory Intel abychom prozatím v tabletech a smartphonech špendlíkem hledali. Důvody můžeme spatřovat jak v prozatím malé důvěře zákazníků a výrobců, tak v poměrně vysoké spotřebě a pouze průměrném výkonu procesorů Atom. Intel se při vývoji procesorů zaměřuje hlavně na co největší počet jader a na multithreading (u Intelu známý pod označením hyperthreading). Vícejádrová struktura CPU přináší výhodu v případě, kdy je nutné najednou zpracovat větší množství paralelně zpracovatelných podprocesů. Správné řízení hypethreadingu je ale poměrně složitou záležitostí a paralelní zpracování aplikací a vysoká datová propustnost navíc nejsou u mobilních zařízení ani tak důležité. Pokud například budete chtít na mobilu někomu ukázat zajímavý videosoubor, většinou nechcete na jeho spuštění čekat příliš dlouho, ale zrovna dekomprese velkých videostreamů je úkol, který hyperthreading zvládá jen obtížně. V takovém případě je výhodnější využít jedno jádro s vyšším výpočetním výkonem.

To je přesně to, co Intel vylepšil v nadcházející generaci procesorů Atom s kódovým označením Silvermont, když nahradil hyperthreading současných modelů Atom Saltwell mnohem výkonnějšími jádry a navíc dramaticky snížil spotřebu. V porovnání se současnou generací procesorů Atom Saltwell by měly nové čipy Silvermont spotřebovat pouze pětinu elektrické energie.

Třikrát rychlejší než předchůdce

Zásadní inovací je u procesorů Silvermont možnost zpracování kódu prediktivním způsobem out-of-order. Z hlediska architektury klasických CPU se nejedná o žádnou novinku, a Intel tento způsob zpracování programového kódu uvedl už u Pentia Pro, ale u Atomů zatím vždy používal kombinaci hyperthreadingu a zpracování kódu sekvenčním způsobem in-order. Procesor při zpracovávání programu vykonává řadu operací. Současné Atomy tyto instrukce vykonávaly v přesné posloupnosti tak, jak byly po sobě seřazeny v programu (tedy metodou in-order), což není s ohledem na architekturu vícejádrových procesorů vždy ideální. Při sekvenčním zpracování kódu totiž musí procesor čekat na výsledky předchozích výpočtů jednoho programového vlákna, i když by mohl zpracovávaný kód rozdělit do několika vláken paralelně zpracovávaných jednotlivými jádry CPU, která jsou však nečinná a dochází ke zbytečným prodlevám. Při zpracování kódu způsobem out-of-order je pořadí provádění operací optimalizováno, takže nedochází ke zbytečnému čekání a Silvermont tak v porovnání se Saltwellem dokáže za jeden takt zvládnut až o 50 procent víc instrukcí. Obzvláště silná je nová mikroarchitektura při provádění nejdůležitějších výpočtů, tedy integer operací a operací s plovoucí čárkou (násobení a dělení). Podle Intelu by měla být celková výkonnost nového Atomu v porovnání se stávajícími modely třikrát vyšší.

Jádra nových Atomů mají stejnou délku instrukční pipeline, ve které jsou prováděny příkazy, jako předchozí generace. Díky tomu, že nemusí tak často přistupovat do vyrovnávací paměti, ušetří Silvermont při provádění instrukcí obsažených v jedné pipeline tři takty. Zajímavá je rovněž predikce skoků, která má za úkol co nejefektivněji předpovídat, kdy je nejvhodnější zpracovat jaké části kódu. Intel podle svého vyjádření tuto predikci u Silvermontu ještě vylepšil a zkrátil časový úsek nutný pro obnovu výpočtů po chybném prediktivním skoku. Díky tomu bylo rovněž možné použít agresivnější predikci než u předchozích procesorů.

Vylepšení se dočkala i vyrovnávací paměť. Dvojice jader procesoru přistupuje ke společné 1MB L2 cache. Výhodou je, že celá kapacita cache je přístupná i v případě, kdy je vytíženo pouze jedno jádro. Zvýšení výkonu přinese i kratší latence přístupu do vyrovnávací paměti, daná trojnásobně větší kapacitou tzv. Translation Lookaside Bufferu (TLB), který zvládne u Silvermontu až 48 záznamů. TLB obsahuje odkazy na paměťové adresy nedávno použitých příkazů, což vede ke zrychlení jejich opakovaného načítání.

Menší, vyšší a úspornější

Přes všechna výkonnostní vylepšení se Intel soustředil u Silvermontu hlavně na energetickou úspornost. V porovnání se stávajícími 32nm procesory Atom bude nový Silvermont vyráběn 22nm výrobním procesem a kromě zmenšení tranzistorů bude také poprvé v této řadě CPU používat 3D tranzistory Tri-Gate, které k provozu potřebují menší spínací proud, pracují rychleji a méně trpí nechtěným prosakováním proudu.

Díky tomu, že nové Atomy budou postaveny na stejné architektuře jako desktopové a serverové procesory, bude Intel schopen dodávat škálovatelné procesory pro všechna zařízení, od smartphonů až po nejvýkonnější počítače. Intel tak bude schopen vyrábět procesory Atom až s osmi jádry, přičemž v první fázi počítá s tím, že do tabletů bude dodávat CPU se čtyřmi jádry, do smartphonů pak minimálně se dvěma fyzickými jádry. Nová technologie Burst Technology 2.0 umožní rychlejší dosažení maximální frekvence CPU, a co je u procesorů určených pro mobilní zařízení ještě důležitější, zajistí také mnohem rychlejší zpomalování taktu v případech, kdy nebude procesor vytížen. Na rozdíl od konkurence dokážou jednotlivá jádra nezávisle přecházet do spánkového režimu.

Alespoň papírově to vypadá, že Intel přinese v podobě procesorů Silvermont čip, který bude výkonově i energeticky silnou konkurencí čipů Krait a Cortex. První tablety s novým Atomem (kódově označovaným jako Bay Trail) by měly být k dostání již letos před Vánoci, na první smartphony (s CPU Merrifield) si pak počkáme do začátku roku 2014.

autor@chip.cz

NOVÉ MOBILNÍ PROCESORY INTEL

Zásadní inovace nových procesorů pro mobilní zařízení spočívá v tom, že Intel použil technologie, které měl doposud vyhrazeny pro vyšší řady CPU a které do kategorie Atomů zatím nebyly implementovány. Namísto sekvenčního zpracování příkazů dokážou nové Atomy řadit instrukce podle vlastních predikčních algoritmů (out-of-order), což urychluje zpracování aplikací, ať už jsou, nebo nejsou optimalizovány pro více jader, a minimalizuje tak prodlevy procesoru.

PRINCIP

Procesor přijímá příkazy, dělí je na jednotlivé kroky či operace (OP) a ty pak vykonává buď po sobě, nebo na přeskáčku.

1 In-order zpracování spočívá v sekvenčním vykonávání příkazů podle toho, jak jsou za sebou napsány programátorem.

2 Při out-of-order zpracování se nejprve seřadí instrukce do fronty a jejich pořadí se přeskupí tak, aby byl ideálně využit plný potenciál CPU.

ZPRACOVÁNÍ

Procesory Silvermont zpracovávají instrukce jinak než předchozí verze Atomů Saltwell.

1 Příjem instrukcí

Procesor nejprve načítá příkazy, nebo lépe řečeno jejich logické adresy. Poté CPU kontroluje v L1 cache, zda nebyly příchozí příkazy v nedávné době zpracovány, logické adresy příkazů se ukládají do výrazně zvětšené ITLB (Instruction Translation Lookaside Buffer). Příkazy poté směřují do příkazové paměti.

2 Dekódování instrukcí

O dekódování instrukcí se starají dva paralelně pracující dekodéry, které převádějí příkazy do strojového kódu srozumitelného pro procesor. Intel používá u Silvermontu méně mikrooperací (mikro kód), protože procesor dokáže zpracovávat i makrooperace, což spoří strojový čas.

3 Distribuce příkazů

Jádra nového Atomu vykonávají příkazy způsobem out-of-order. Mikrooperace (mikro OPs) ukládá do fronty a seřadí je tak, aby při jejich zpracování pracoval CPU co nejefektivněji. Starší Saltwell zpracovává příkazy v tom pořadí, v jakém do něj přicházejí.

4 Provedení

Poslední krok spočívá v provedení operací výkonnými jednotkami (EU).

 

Dokumenty ke stažení