Seriál Člověk proti stroji
Část 1: Porozumění řeči: Může s námi počítač komunikovat?
Část 2: Fotbalový zápas: Kopou roboti lépe než reprezentační jedenáctka?
Část 3: Zrakový test: Má počítač ostřejší zrak?
Část 4: Absolutní sluch: Kdo slyší více zvukových frekvencí?
Část 5: Perfektní čich: Cítí počítač jednotlivé molekuly?
Část 6: Úchopový test: Je stroj přesnější než naše ruka?
Kdo vidí lépe?
Oko je náš nejdůležitější smyslový orgán – a za strojem silně zaostává. Přesto se výzkumníci snaží propůjčit robotům lidský zrak.
MANUEL SCHREIBER
Kolem 13,2 miliardy světelných let – tak daleko je od nás nejstarší nám známá galaxie zachycená Hubbleovým teleskopem. 0,1 nanometru malé atomy zase pozoruje elektronový mikroskop Team 0.5. Tato dvě úžas budící čísla představují hranice, v nichž se pohybují možnosti současných kamer.
2,3 milionu světelných let je vzdálena nejodlehlejší galaxie, kterou může vidět člověk, cca 1000 nm měří nejmenší, prostým okem viditelný objekt. To jsou hranice schopností lidského oka.
Stroj vidí podstatně více detailů a mnohem ostřeji, než by kdy dokázalo oko. Kromě toho se každá objektivem zachycená informace ukládá. Ani to lidské oko neumí. Přesto vědci už dlouhá léta pracují na metodách, jimiž by se lidské vidění dalo napodobit, neboť na rozdíl od robota se člověk může do objektu "vmyslet" – a špatnou kvalitu obrazu jednoduše zanedbá.
Opticky pozadu: Člověk si své vjemy domýšlí
Lidské oko se může soustředit na jeden objekt a ten zaostřit, bleskurychle reagovat na kolísání jasu a registrovat nejjemnější kontrasty. Přesto člověk vnímá pouhý zlomek toho, co zachytí kamera a zvěční na obrázku. Přitom to, co vidí oko, má k perfektnosti daleko. Právě naopak, hemží se to obrazovými chybami, jaké by fotograf u svého přístroje nikdy neakceptoval. "Chromatická aberace lidského oka je špatná. Další chybou je slepá skvrna," vysvětluje dr. Michael Bach, profesor univerzitní oční kliniky v německém Freiburgu. Chyby ale mají také objektivy. Nejmenší obrazový šum, posuny barev a vinětaci, to všechno vidí na fotkách fotograf. "Vidíme víc, než vidíme. Když držíme fotku v ruce a díváme se na ni, je to úplně jiná situace," tolik Bach. Zde totiž může oko detaily pozorovat postupně a porovnávat.
Ve skutečnosti nemají objektivy téměř žádné slabiny. Kvůli minimalizaci optických vad sestává objektiv z několika spojných a rozptylných čoček z různých druhů skel, které lámou světlo tak, aby nafocené snímky vypadaly co nejčistěji i při okrajích. Objektiv proto naše oko daleko předstihuje. Jednu slabinu však má: jeho zorné pole, tedy zobrazitelná oblast, je vždy omezené. Normální objektiv může horizontálně zachytit jen asi 45 až 50 stupňů, naproti tomu oči plných 180° – ostře ale jen malou oblast. Je tomu tak proto, že už při odchylce pouhých 10° klesá zraková ostrost na pětinu.
Oko však nejen že skutečně ostře vnímá jen malou oblast zorného pole, ale navíc všechny barvy vidí jenom uprostřed sítnice, kde jsou koncentrovány příslušné barevné receptory, tzv. čípky. Kolik detailů a v jakých barvách nakonec kamera zaznamená, o tom rozhoduje senzor se světlocitlivými buňkami a nad nimi umístěnou barevnou vrstvou se základními barvami červená, zelená a modrá (viz schéma). Čím více pixelů senzor má, tím víc obrazových bodů může fotograf později dostat na papír. Jak vysoké rozlišení ale fotka skutečně musí mít, to závisí na způsobu jejího nasazení, poněvadž porovnání počtu pixelů s okem zde nefunguje: zatímco oku při obvyklém formátu 10 x 13 cm ze vzdálenosti cca 40 cm stačí už 5 megapixelů, rozlišení na formátu A3 za stejných podmínek musí vykazovat tučných 16 megapixelů, aby oko nevnímalo jednotlivé obrazové body. Jak dobře tedy může oko rozlišovat, to záleží na vzdálenosti a velikosti objektu.
Oko za fotografickým přístrojem zřetelně zaostává – přesto si člověk všech těch jeho nedostatků a problémových zón ani nevšimne. Vysvětlení tohoto fenoménu: "Mozek si vnitřní reprezentaci světa domýšlí na základě neúplných informací," říká profesor Bach. Kompenzuje tím chyby a prostě "vynalézá" dobrý obraz.
Proto se také vědci pro inteligentní systémy snaží napodobovat nikoli oko, ale zpracování obrazů v mozku. Stroje umějí snímat perfektní obrazy, ale nevědí, co je na nich zajímavého: stroji chybí inteligentní vidění.
Intelektuálně pozadu: Kamera se musí učit myslet
Tento problém se snaží řešit mezinárodní TACO-Team (Three-dimensional Adaptive Camera with Object Detection and Foveation). Vědci zde však nepracují s běžnými fotoaparáty. Jak systém TACO rozpozná 3D model svého okolí, to vysvětluje člen týmu Peter Einramhof, inženýr z technické univerzity ve Vídni: "U naší kamery se přísně vzato jedná o laserový skener. Pulzující laserový paprsek je přitom systémem mikrozrcadel horizontálně i vertikálně vychylován, čímž scénu před kamerou ‚narastruje'. Za sekundu je takto vyslán až jeden milion laserových pulzů a u každého odměřena doba do návratu po odrazu," říká Einramhof. Podobně jako oko má tato kamera velké zorné pole s malým rozlišením. Teprve když spatří něco zajímavého, soustředí se na to a zobrazí to v lepší kvalitě. "Výsledkem je tzv. saliency map, v níž světlé oblasti označují důležité a tmavé oblasti nedůležité partie scény." Samotná kamera ovšem žádné objekty nerozeznává. Záměrem je jenom viděné připravit, aby se například robotům usnadnilo další zpracování.
Inteligentní vidění je zajímavé nejen pro roboty a průmyslové stroje. Například ve vozidlech podporují kamery lidské oko třeba tím, že ovládají dálková světla, kontrolují jízdní stopu a rozpoznávají dopravní značky, které by řidič případně přehlédl. Potíže těchto systémů velmi dobře zná dr. Werner Huber, vývojový pracovník asistenčních systémů v automobilce BMW: "Když má jedna kamera obsluhovat hned tři různé funkce, není to lehká úloha. Používáme pro ni malý trik. Kamera snímá 45 obrazů za sekundu, které se pak rozdělují tak, aby každá funkce obdržela pro svou úlohu 15 snímků za sekundu," objasňuje Huber. Například pro rozpoznání dopravní značky porovnává kamera obrazy s databankou. Jako doplněk pak software využívá informace navigačního systému. Kvalita obrazu téměř nehraje roli – jednoduchá VGA kamera s pevnou ohniskovou vzdáleností stačí.
Závěr: Existují i speciální řešení kamer, zrakové výkonnosti člověka však nedosahují. Problémem ale není oko: "Napodobit oko považuji za triviální úkol – a také nepotřebný, neboť s výsledkem by nikdo nebyl spokojen. Vlastní vidění obstarává náš mozek," říká lékař Bach. Největší výzva tkví v úloze "přimět kameru, aby spolehlivě identifikovala části scény skutečně relevantní pro danou úlohu". Kdy se to podaří, to si ještě nikdo netroufá odhadnout – a do té doby nebude kamera ničím víc než technickou pomůckou lidského oka.
AUTOR@CHIP.CZ
Člověk
JAK OBRAZY VNÍMÁ OKO
Oko se svému okolí přizpůsobuje jen do té míry, nakolik je to nutné. Skutečně dobrý obraz vzniká až v mozku.
Slepá skvrna
Zrakový nerv přenáší obrazové informace do mozku. V místě jeho vyústění na sítnici je člověk slepý.
Čočka
Oblast zaostření sahá od cca 10 cm do nekonečna. Zorné pole obou očí zabírá horizontálně zhruba 180°.
Rohovka
Přebírá 80 % optické mohutnosti čočky a je tak společně s ní odpovědná za ostrost vidění.
Duhovka a zornice
Duhovka je clona lidského oka. Ovládá velikost zornice, která se může měnit od 1,5 do 12 mm – to odpovídá hodnotě clonového čísla u objektivu asi 2,6 až 16.
Sítnice
To je na světlo nejcitlivější vrstva oka a odpovídá senzoru v kameře.
Tyčinky Cca 124 milionů tyčinek se stará o vnímání jasu a kontrastu.
Čípky Kolem 6 milionů čípků odpovídá za barevné vidění.
Jak oko zaostřuje
Díky proměnné vypouklosti čočky vidíme na všechny vzdálenosti ostře – ale jen v úzkém kuželu s vrcholovým úhlem asi 2°.
Přednosti a slabiny
+ Velké zorné pole
- Slepá skvrna
- Velmi malá oblast ostrosti
- Mnoho obrazových vad, jako barevné olemování (chromatická aberace)
- Malé rozlišení
Stroj
JAK OBRAZY VYKRESLUJE KAMERA
Optické přístroje mohou zachytit téměř perfektní obrazy. O kvalitě rozhoduje především systém čoček v objektivu.
CCD senzor – umělá sítnice
Světlocitlivé buňky (pixely) sestávají ze čtyř subpixelů pro barvy červenou, zelenou (2x) a modrou (RGB). Čím větší je hustota pixelů, tím více detailů senzor zachytí.
Systém čoček objektivu
Kombinace více čoček zabraňuje zobrazovacím chybám, jako vinětaci, chromatické aberaci a zkreslení.
Spojné čočky Soustřeďují dopadající světelné paprsky.
Rozptylné čočky Světlo znovu rozptylují a posouvají tak ohnisko.
Jak clona ovládá dopad světla
Stejně jako duhovka v oku řídí zde množství dopadajícího světla clona. Dobré objektivy mají clonové číslo 1,4 až 16. Číslo určuje poměr ohniskové vzdálenosti k průměru clonového otvoru. Čím menší je toto číslo, tím více světla pronikne k senzoru.
Přednosti a slabiny
+ Téměř žádné chyby obrazu
+ Spojitě ukládá všechny obrazové informace
+ Velká oblast ostrosti
- Malé zorné pole
- Velký a těžký systém čoček