Natáčí teď prezident i porno? Pomocí aplikace s umělou inteligencí mohou nyní i úplní laici měnit tváře ve videích. Znamená to ale skutečně konec důvěryhodnosti?
Aplikace typu Face Swap jsou zábavou na každé party: stačí jedno kliknutí a vaše vlastní tvář zdobí tělo přítele, filmové hvězdy nebo tichých hrdinů historie techniky. Dokonce i Facebook, Yahoo a Microsoft nabízejí své vlastní programy pro výměnu tváří jedním kliknutím. Nová aplikace však vystavuje již tak dost pošramocenou důvěru ohledně pravosti a osobnostních práv na internetu úplně nové zkoušce: na začátku ledna vydal uživatel sociální sítě Reddit s označením /u/deepfakes software, který umožní i začátečníkům zaměnit tvář za jinou dokonce přímo ve videu. Výsledek se zdá klamavě reálný: nová tvář se spojí s původní hlavou v realistický hybrid. Dokonce i výrazy obličeje originálu jsou převzaty do falešného.
Transplantace tváří s překážkami
Všechno, co k tomu potřebujete, jsou jen dvě videa: jedno s obličejem dárce, jedno s příjemcem; v obou musí být příslušné obličeje jasně viditelné. Technicky je výměna obličeje trochu náročná. Program běží pouze na počítačích se systémem Windows a s výkonnou grafickou kartou Nvidia (co možná nejnovější) - kdo pak je schopen zhlédnout ještě několik zevrubných výukových videí na YouTube, má několik hodin času a je odolný proti frustracím, ten dokáže transplantovat tváře dokonce i sám. A samozřejmě to bylo nejprve vyzkoušeno na pornu. Teprve poté, co byly tváře slavných hollywoodských hereček transplantovány prostřednictvím aplikace FakeApp do hlav pornohereček, stal se z poněkud nerdské zábavy skutečný malý mediální humbuk. Co se stane se skutečností, když je tak snadné ji falšovat?
A je tu ještě něco. Výzkumné a vývojové skupiny pracují už roky na softwaru, který umožňuje volně měnit obrazy a videa, stejně jako hlasové a zvukové nahrávky. Například na konci loňského listopadu společnost Adobe představila svůj program Voco, což je takový Photoshop na mluvenou řeč, pomocí kterého lze přepisovat, krátit a kopírovat mluvený text i vytvářet zcela nový text - a to vše původním hlasem. V kombinaci s aplikací Face Swap pro výměnu tváří vzniká obava, že videa o skutečných lidech mohou být vyráběna pomocí mluvících panenek. Mezi fake news a alternativními fakty tato myšlenka rezonovala jako varování, že ztráta důvěry už dávno začala. A pokud uvěříme prognóze Google trendů, pak kariéra termínu deepfakes teprve teď získává skutečnou dynamiku.
Pravdivý příběh lží
K tomu je potřeba říci tři věci. Za prvé, videa vytvářená pomocí falšujících aplikací jsou sice působivá, ale stále mají daleko k tomu, aby byla opravdu přesvědčivá. Stejně jako jednoduchý animovaný GIF nebo YouTube video s nízkým rozlišením vás mohou na chvíli oklamat. V každém případě ale musí být zdrojové video dobře osvětlené a měly by být viditelné pouze jednotlivé tváře s omezenou mimikou a především s omezeným pohybem. Výsledný fake je spíš testem zručnosti, který funguje jen za určitých specifických podmínek. To, že trik s výměnou tváří byl úspěšný zrovna v oblasti pornografie, je způsobeno nejen voyerismem, ale také produkční a estetickou realitou pornozáběrů: s jasně osvětlenými herečkami, jejichž tváře jsou díky make-upu hladké jako panenka, vychází transplantace obličejů mnohem lépe.
Za druhé, vytváření těchto videí není triviální. Ti, kteří prošli vyhledávání videí na (nyní smazaných) fórech Deepfakes, zde většinou našli jen nezdařené podvody a bezmocné žádosti o pomoc: Proč je můj fake tak špatný? Kvůli několika málo sekundám falešného videa musí být algoritmus trénován celé hodiny. Jednotlivé filmové rámečky v tréninku mohou ovlivnit celý výsledek fake videa. A bez ohledu na to, jak dobré jsou předpoklady, zůstane v divákovi vždy pocit „tady - ale - něco - nesedí“ - typická známka simulace reality, která je dobrá, ale není dost dobrá.
Za třetí, a možná ze všeho nejdůležitější: amatérská manipulace s obrázky, dokonce i s pohyblivými obrázky, není v žádném případě novinkou. Od počátků fotografování bylo toto médium obviňováno z falšování a inscenace. Jednou z prvních známých manipulací s obrazy byla právě transplantace hlavy: Abraham Lincoln s tělem Johna C. Calhouna - montáž, na které měl Lincoln vypadat lépe než ve skutečnosti. Snímky neodrážejí realitu, ale reprezentují. „Cokoliv se objeví na scéně,“ píše kulturní vědec Helmut Portlethen ve své oceňované eseji Stín fotografa, „podléhá skepsi, zda to, co je vidět, není pouhým podvodem, falešnou konstrukcí, nebo alespoň zmanipulovanou formou skutečnosti.“ Podvod jevící se jako skutečnost a skutečnost jevící se jako podvod není vedlejším aspektem fotografie, ale jednou z jejích konstant: fotografie a film si vždy hrají s vizualizací a zastíráním skutečnosti -autenticita je u tohoto média vždy lživá. A to je to, co ho dělá tak vzrušující.
Když se obrazy naučily lhát
Tato nejistota byla digitální fotografií ještě zesílena. To, co reprodukuje obrazový soubor, je vysoce umělý produkt: artefakt algoritmické interpretace reality, výsledek technicky založené psychologie předběžného výběru, kterou obrazový přístroj interpretoval na datové toky. Paradoxně, v době masové produkce obrazů existuje velké očekávání, že fotografie a film budou ukazovat stále realističtější skutečnost: když obrazy vytváříme neustále a všude, nebude svět zaznamenáván stále přesněji a nezkresleně?
S realistickými videomontážemi a aplikacemi, jako je Voco, se tento rozpor a související sebeklam stávají zřetelnějšími. Otázkou není, kterým obrázkům ještě můžeme důvěřovat, ale jak přežít tuto nejistotu. To ale není výjimečná situace - takový konflikt nastává vždy, když se objeví nové formy sebeuvědomění a reflexe světa. A stejně jako u jiných technických inovací se vytvoří nový společenský přístup k dosud neznámým možnostem. Vzhledem k tomu, že strojové zpracování obrazu zanechává stopy, vznikne také nová technologie, která bude schopna odlišit pravdu od podvodu. Mnohem více se ukáže nové pochopení sebe sama - stejně jako dříve v případě nových způsobů záznamu a zpracování obrazu a zvuku.
A i když se o potenciálu padělání v současné době hojně diskutuje, existuje také mnoho příležitostí k tvůrčímu projevu. Protože tím je FakeApp také: fantastickou hračkou. Důsledkem tohoto rozvratu nebude ztráta reality, ale její posílení.
Foto popis| Výpočet reality FakeApp používá druhé vstupní video k výpočtu nejlepších překryvů dvou obličejů. Proces trvá hodiny.
Foto popis| Už v roce 2016 ukázali vývojáři, jak v reálném čase přenášet něčí mimiku obličeje na tvář někoho jiného.
O autorovi| FELIX KNOKE, autor@chip.cz