3D filmy pro Blu-ray
Prostorový filmový zážitek si díky novým technologiím můžete jednoduše dopřát i v pohodlí obývacího pokoje. Ovšem skrývá se za tím poměrně složitá technologie a nové kódování MultiView standardu H.264. Ukážeme vám, jak to funguje.
MARKUS MANDAU
Po velkém úspěchu filmu "Avatar" se multimediální průmysl naplno pustil do nového trendu – do 3D. Nová generace televizorů a Blu-ray přehrávačů přinese 3D do obývacího pokoje, abyste si i doma mohli dopřát podobný zážitek jako v kině. Ve stejné době vypustí Hollywood novou generaci disků: první Blu-ray disky se právě začínají objevovat v obchodech, hlavní nápor se však chystá až na letošní Vánoce. Formát filmů uložených na discích Bluray řeší profil "Stereo High Profile", což je rozšíření standardu H.264 (podívejte se na grafiku dole).
V tomto případě znamená pojem "stereo" stereoskopicky vidět a vychází z prostého faktu, že prostředí kolem nás sledujeme dvěma očima. Náš mozek dostává informace ze dvou očí, které sledují prostředí z různých úhlů. Z těchto dvou obrazů se pak v mozku tvoří trojrozměrný vjem. Podobně to tedy musí fungovat i v případě filmu: 3D televizor vysílá separátní snímky zvlášť pro levé a zvlášť pro pravé oko. Teoreticky je tedy potřebný dvojnásobný prostor pro uložení takovéhoto filmu: dvourozměrný film na Blu-ray má 24 snímků za sekundu – 3D Blu-ray tedy potřebuje 48 snímků.
Nejjednodušším způsobem, jak tento problém vyřešit, by tedy bylo uložit na Blu-ray dva video streamy. To však přináší nejrůznější komplikace: celý videobitrate je omezen na 40 MB/s. U 3D disku by pak zůstalo pouze 20 MB/s na "jeden film", což ale nestačí na zaručení optimální kvality obrazu.
Toto zúžení překonává kódování nazvané MVC (MultiView Video Coding). Základní koncept, na kterém toto kódování funguje, vychází z toho, že obraz určený pro levé oko se jen velmi málo liší od obrazu určeného pro pravé oko. Potom se tedy MVC film skládá ze dvou streamů – jeden je pouze základní ("Base View") a je kódován podobně jako klasické 2D video a druhý ("Non Base View") není spustitelný bez toho základního a vychází z něho.
Tato predikce ("Inter-View Prediction") je základem nového profilu Stereo High Profile standardu H.264. Paměťové požadavky se takto v případě druhého streamu sníží o 50 procent.
Videokomprese je umění – umění, kdy je potřeba ušetřit co nejvíce úložného prostoru (nebo datového toku), aniž by se přitom obětovala viditelná kvalita výstupu. Kodéry MPEG-2 nebo H.264 ukládají pouze zlomek snímků jako plné snímky (I-Frames), tedy podobně jako JPEG. Kodér derivuje z tohoto plného snímku (I-Frame) dva další typy snímků: P a B.
Odvozeny jsou dva typy informací: rozdíl v obsahu snímku, tedy rozdíl jasu a barevných hodnot, stejně jako vektory pohybu. To odkazuje na bloky ze snímku, které mají stejný obsah, ale v odvozeném snímku jsou umístěny na jiném místě. Speciálním případem jsou bloky, které jsou označeny jako "vynechané". To se stane v případě, kdy se mezi sebou snímky neliší.
Snímek I (I-Frame) a snímky od něj odvozené dohromady tvoří Group of Picture (GOP). Zpravila se tato skupinka GOP skládá z 12 až 24 snímků – což je zhruba půlsekunda až sekunda filmu. Kromě I-snímku (I-Frame) zahrnuje alespoň jeden P-snímek, který je odvozen pouze z předchozího I-snímku. B-snímky se vztahují k předchozímu i následujícímu I-snímku a P-snímku. Úspora místa je obrovská: v HD filmu s přenosovou rychlostí 7 MB/s se na I-snímek potřebuje něco kolem 100 kilobajtů, snímek P zabere jen 50 KB a snímek B jen 20 KB. U H.264 může být B-snímek odvozen z jiného B-snímku, a proto je pro vložení do hierarchie nutné, aby přehrávač věděl, které snímky má dekódovat jako první – musí být proto uložen ve vyrovnávací paměti. Dekodér vyžaduje vhodný I- a P-snímek a také B-snímky z kroku 1 a 2, aby se mohl zobrazit B-snímek z kroku 3.
Snímky: Hierarchie v 3D
Hierarchie snímků slouží jako základ pro predikci střídání snímků v 3D. Stejně tak 3D – GOP obsahuje pouze jeden I-snímek jako startovací obrázek "Base View" a jeden P-snímek "Non Base View". Zbytek se skládá z B-snímků, přičemž zbytky z "Base View" se derivují z "Non Base View". Ačkoli se jas a barvy obou souběžných B-snímků trochu liší, v zásadě je rozdíl mezi jejich hodnotami velmi nízký a na kvalitu nemá vliv. Čím menší snímek je, tím lépe může být zkomprimován, takže obrázky pro "Non Base View" celkem spotřebují zhruba jen polovinu místa, které zaberou obrázky pro "Base View".
Jedním z nejdůležitějších požadavků při stanovování nového standardu bylo, aby byl nový profil zpětně kompatibilní s tradičními přehrávači. Tímto způsobem je pak 3D disk možné přehrát i na běžném Blu-ray přehrávači. Tato možnost je dána rozdělením snímků na "Base View" a "Non Base View". 2D přehrávače pak jednoduše nerozpoznají snímky z "Non Base View" a přehrají pouze snímky z "Base View" jako normální stream Blu-ray. Tím je zachována ona požadovaná zpětná kompatibilita.
Tenhle trik funguje, protože data videostreamu H.264 jsou navíc posílána i v NAL paketu (Network Abstraction Layer). Snímky z "Non Base View" jsou slepeny v novém typu paketu, se kterým si poradí jen MVC dekodéry umístěné v 3D přehrávačích. Takže i když nevíte, zda budete jednou na 3D přecházet, můžete si klidně 3D film pořídit a sledovat ho i na 2D přehrávači. Později se vám třeba bude hodit.
AUTOR@CHIP.CZ
H.264 – STANDARD, KTERÝ SE NEUSTÁLE ROZŠIŘUJE
Standard H.264 podporuje mnoho zařízení. Je to dáno rozdělením profilu do několika skupin, pro které jsou definovány podmínky pro povolenou kompresní technologii. Pak je možné, aby základní profil zvládla i malá zařízení, jako jsou smartphony, a naopak některá zařízení si poradí s novým profilem Stereo High Profile pro 3D Blu-ray.
Stereo High Profile (např. 3D-Blu-ray, 3D-TV)
Stereoview
Film se skládá ze dvou streamů – základního "Base View" a "Non Base View".
Inter-View Prediction
Všechny snímky videostreamu (Non Base View) jsou odvozeny z jiných streamů (Base View).
High Profile (např. Blu-ray, HDTV)
CABAC
Sofistikovaná komprese na bitové úrovni, která je účinnější než CAVLC.
Bloky 8×8
Menší velikost bloků umožní lepší kompresi.
B-Frames
Snímky jsou odvozeny z I-, P- a B-snímků.
Field Coding
Výstup s prokládanými snímky je nutný kvůli přehrávání na televizoru.
Baseline Profile (např. iPhone)
P-Frames
Jsou odvozeny z plných (JPEG) snímků.
Motion Compensation
Odvození bloků prostřednictvím pohybu vektorů
CAVLC
Komprese na bitové úrovni podobná ZIP
Deblocking
Filtr blokuje části s nízkým bitratem.
UVNITŘ STRUKTURY 3D FILMU
V případě 3D filmu jsou pro každé oko (levé a pravé) zobrazovány rozdílné snímky (Frames). Proto jsou také snímky určené pro levé oko často rozdílné od těch určených pro pravé oko. Dalo by se říct, že jde o dva různé 2D filmy a struktura filmu tak odpovídá normálnímu videostreamu: I-snímek je zakódován jako JPEG a další dva typy snímků se ukládají jako rozdíly oproti tomuto snímku a vychází z něj.
I-snímek: Je uložen jako plný snímek, podobně jako JPEG.
P-snímek: Je odvozen pouze z I-snímku.
B-snímek: Může se vztahovat k předchozímu nebo následujícímu I-, P-, nebo B-snímku.
Foto: 3D filmy jako Avatar mají komplexní snímkovou strukturu.