Vyhledávejte v multimédiích
V oblasti obsahového prohledávání multimédií patří někteří čeští odborníci ke světové špičce. Tito experti předpovídají, že technologii obsahového prohledávání čeká již brzy prudký vzestup.
MICHAL ČERNÝ
Záplava multimediálních dat se na nás valí ze všech stran, skoro jako by hrozilo, že se v ní brzy utopíme. Internet – to už dávno samozřejmě nejsou jednoduché číselné nebo textové údaje. Digitalizuje se kdeco, počínaje novinovými archivy z roku 1850 přes výroky současných politiků až po videozáběry ze zahraničních válek. Gigabajty a terabajty multimediálních dat v různých podobách, v nichž se nikdo pořádně nevyzná a neumí je porovnat a efektivně uspořádat.
Naštěstí se rýsuje řešení: multimediální prohledávání podle obsahu a podobnosti. Každý ví, že nejpoužívanější vyhledávače současnosti, jako je například Google, indexují obrázky pouze podle přiřazených textových informací. Cíl, který se vynořuje z datové potopy, zní takto: Vytvořit inteligentní prohledávání, které by analyzovalo samotný obsah multimediálních dat, navzájem by tato data porovnávalo a nakonec by sestavilo přehled obrazových, zvukových či video souborů, které si jsou navzájem obsahově, vnitřně podobné.
Hledání pornografie nebo DNA
Podobnostní vyhledávače, jako je například Mufin nebo ALIPR, z obrazů vyextrahují informace o obsažených tvarech, barvách a texturách. Inteligentní matematické algoritmy potom prohledají databanku statisíců obrazů, a výsledkem je přehled fotografií, které si jsou navzájem tvarově nebo barevně podobné. Různé zdroje na internetu informují o možných praktických využitích této technologie, počínaje vyhledáváním závadného pornografického materiálu přes analýzu podobných sekvencí DNA až po porovnávání záznamů v medicínských databázích – tím by se mohla ulehčit práce lékařům při stanovování diagnózy. Celá věc má ale jeden háček: technologická úroveň současných obsahových vyhledávačů není v mnoha ohledech na takové úrovni, aby bylo možné tyto aplikace bez problémů dotáhnout do komerční podoby.
Čeští odborníci a výzkum IBM
"Dosavadním pokusům o vytvoření obsahového vyhledávače vždycky něco scházelo," říká David Novák, jeden z odborníků Fakulty informatiky Masarykovy univerzity v Brně. "Jednoznačně platí, že nekompromisním měřítkem kvality je uživatel. Buď nejsou analýza obrazu a podobnostní vyhledávání v dané aplikaci dostatečně kvalitní, takže výsledky mohou uživatele zklamat, nebo systém nevyhledává v dostatečně velké kolekci dat, a může se tedy stát, že se v ní obrázky podobné zdrojovému nevyskytují, případně aplikaci chybí rozumný obchodní model, takže uživatele nezaujme."
V České republice se obsahovým vyhledáváním zabývá tým vytvořený kolem profesora Pavla Zezuly na Fakultě informatiky Masarykovy univerzity v Brně. Tito odborníci se zúčastnili několika mezinárodních projektů vedených výzkumným centrem IBM v izraelské Haifě. Podíleli se například na projektu SAPIR (Search on Audio-visual content using Peer-to-peer Information Retrieval), v jehož rámci svoji vyhledávací technologii zdokonalili a použili na kolekci dat o velikosti 100 milionů obrázků.
Otevře Pixmac cestu?
Z práce týmu vyplývá, že v současnosti se velmi blízko komerčnímu použití ocitá několik aplikačních oblastí. Jde například o porovnávání biometrických dat – podobnostní vyhledávače by byly schopné ve zlomku vteřiny prohledat databázi a najít shodné otisky prstů, skeny tváře nebo oční duhovky. "Další zajímavou oblastí je analýza časových řad," říká David Novák. "Jde o rozbor a porovnávání vývoje různých hodnot v čase – tedy vhodná aplikace pro obchodníky s akciemi, spekulanty s měnami a podobně. Dále lze jmenovat aplikaci pro vyhledávání podobného zboží v e-shopech, kdy by bylo možné najít tvarově nebo barevně podobné boty, brýle, oblečení."
Podobnostní vyhledávání obrazů ocení také novináři nebo grafici, kteří často pracují s obrazovými databankami. Připravuje se například aplikace pro vyhledávání podobných logotypů. Matematické principy vyvinuté týmem Fakulty informatiky v Brně mají být již brzy použity v české obrazové databance Pixmac. "Jsme přesvědčeni o tom, že podobnostní vyhledávání ve fotobankách má pro kreativce obrovský význam," říká David Novák. "Použití ve fotobance Pixmac má být první komerční aplikací, která podle našeho názoru otevře cestu ke skutečnému zájmu o tuto technologii."
Možná nebezpečí
Strážci ochrany soukromí a webové anonymity by mohli namítnout, že technologie obsahového prohledávání může znamenat také určité nebezpečí. Jedno z možných využití se nachází v oblasti sociálních sítí – představme si například, že máme k dispozici fotografii uživatele, a podle ní chceme vyhledat profil na Facebooku. "V obsahovém vyhledávání jakožto principu žádné ohrožení nevidím," namítá David Novák. "Je to podobné, jako kdybychom zpochybňovali používání počítačových sítí, protože mohou být zneužity k útokům. Na druhou stranu si myslím, že by firmy jako Google měly více dbát na ochranu soukromí. Fakt, že nástroj Picasa 3 ihned po instalaci v podstatě bez jakékoli otázky vyhledá všechny obličeje ve vašich fotkách, nepovažuji z tohoto pohledu za úplně šťastný."
MICHALCERNY.MEDIA@SEZNAM.CZ
VYZKOUŠEJTE SI OBSAHOVÉ VYHLEDÁVAČE
MUFIN (Multi-feature indexing Network)
http://mufin.fi.muni.cz/
Projekt týmu vytvořeného kolem profesora Zezuly z brněnské Masarykovy univerzity. Technologie tohoto vyhledávače je navržena velmi obecně, je tedy možné ji použít téměř na jakákoli data a na jakoukoli formu podobnosti. Celý podobnostní index Mufinu může být distribuovaný – při návrhu byly využity principy peer to peer sítí, a proto je tato technologie škálovatelná, tedy schopná fungovat téměř se stejnou efektivitou při rostoucí velikosti databáze. V současnosti systém pracuje s databankou o velikosti 100 milionů obrázků z webu Flickr.
ALIPR (Automatic Photo Tagging and Visual Image Search)
http://alipr.com/
Poloautomatický systém anotace a obrazového prohledávání. Když uživatel na tyto stránky uploaduje nějakou vlastní fotografii, systém mu nabídne textové tagy, kterými je možné fotografii označit. Lze také vkládat vlastní tagy a tím tak podle autorů celý systém učit a rozvíjet. Právě použití kombinace textového označování a vizuálního rozpoznávání se v mnohém podobá technologiím, které budou nasazeny ve fotobance Pixmac.
VIZSEEK
www.vizseek.com
Projekt, který se zaměřuje na prohledávání pomocí tvarové podobnosti a specializuje se zejména na nalézání podobných strojařských součástek. Jedná se tedy o technologii nikoli obecnou, ale přizpůsobenou speciálně pro určitý typ dat. "Systém ale neposkytoval výsledky, se kterými bych byl zcela spokojený," komentoval David Novák výsledky VizSeeku.
Další významné vyhledávače:
Gazopa (www.gazopa.com)
TinEye (www.tineye.com)
Foto: Podobné produkty nebo vývojové grafy: Aplikaci pro obrazovou analýzu ocení jak zákazníci e-shopů hledající určité zboží, tak i obchodníci na burze nebo spekulanti s měnami analyzující opakující se grafické formace.
Foto: Podobnostní vyhledávání: V horní řadě jsou vyhledány obrazy obsahující podobné tvary, v prostřední řadě předměty vyvedené v podobných barvách, ve spodní řadě pak kombinace obojího.