Přejít k hlavnímu obsahu

Špatní boti? Dobří boti!

Boti (běžná zkratka pro softwarové roboty) jsou pro mnohé jen zlé hackerské programy, určené k manipulaci s veřejným míněním. Na Wikipedii však pomáhají autorům a chrání sbírku znalostí před trolly a vandaly.

On-line encyklopedie Wikipedia se dodnes drží fascinujícího přístupu: příspěvky a články nekoncipuje kolektiv renomovaných profesorů. Místo toho to jsou dobrovolníci, kteří píší, revidují a kontrolují nové záznamy. Jejich práce a čas strávený pouze identifikací a revizemi nežádoucích záznamů a změn jsou obrovské. Takže co by se mohlo nabízet více než automatizovat určité, neustále se opakující úkoly?

To je přesně místo, kde mohou boti usnadnit život autorům a zabránit vandalům dělat to, co dělají. V současné době je na anglicky mluvící Wikipedii oficiálně nasazeno 350 těchto samoučících se programů, které nyní mají na svědomí až deset procent změn na této znalostní platformě. Program, jako je ClueBot NG, je neúnavný při rozhodování, kdo může něco psát do tohoto praktického lexikonu. Až 700krát za hodinu je program aktivní při zamezování svévolnému vandalismu v textech a varování před trolly. ClueBot NG je řízen neuronovou sítí, jejíž samoučící se algoritmy pracují podobně jako spamový filtr e-mailového programu. Neustále dostává informace o tom, co autoři Wikipedie považují za vandalismus, a podle toho odvozuje svoje filtrační pravidla.

Čisticí automat proti fotografiím penisů

Termínem vandalismus se rozumí všechny možné destruktivní intervence. Ty sahají od svévolných výmazů přes verbální zneužívání až po promyšlenou manipulaci s cílem ovlivnit ceny akcií a politické PR nebo jen hloupě narušit encyklopedii nahými fotkami. Nezřídka se v článcích najednou objeví fotografie ženského poprsí nebo penisu spolu se sprostými vzkazy. To vše jsou docela zřejmé případy, které mohou boti detekovat a zpracovat. Nejsou ale schopni rozlišit, zda informace obsažené v určité pasáži jsou správné nebo ne. To stále ještě musí rozhodnout lidé. Nicméně pomoc botů na Wikipedii je nyní už nepostradatelná. Jen samotný výpadek botu ClueBot NG by vedl ke zdvojnásobení nezbytných operací mazání obsahu trollů, jak ukazuje například studie R. Stuarta Geigera a Aarona Halfakera z univerzit v Berkeley a Minnesotě. Dalším důvodem pro rostoucí využívání botů je vedle nekonečného objemu informací, které mají být zpracovány, také pokles aktivních autorů Wikipedie. Zatímco v roce 2007 psalo na anglické Wikipedii 50 000 autorů, o deset let později to bylo už pouze 30 000.

Nicméně dobří duchové, kteří by měli autorům v konečném důsledku ulehčit, je mohou také odstrašit. Důvodem je jejich rychlost. Jak zjistili Halfaker a Geiger, účinný boj proti vandalům má negativní vliv na počet nových autorů. Dokonce i když počet nováčků, kteří poprvé vytvořili nebo zpracovali článek, je údajně konstantní, akce botů, kteří tyto příspěvky během několika sekund zruší, se značně zvyšují. Výsledkem je, že mnoha nadějným novým přispěvatelům Wikipedie se takto zabouchnou dveře před nosem a ti už se nikdy nevrátí.

Boti jako pomocníci místo naháněčů hrůzy

Při veškeré potřebné účinnosti by tedy neměla být opomíjena otevřenost novým autorům. Noví „wikipedisté“ mohou získat od botů cenné tipy, kde jejich práce najde nejlepší uplatnění. Ničitel trollů ClueBot NG se také zabývá hledáním položek, které mají být vylepšeny, a identifikuje nejnáročnější rozpracovaná místa.

Vítězné tažení botů na Wikipedii mezitím vedlo k dalšímu jevu - k editačním válkám. Nekompromisní přístup botů se pak stává problematickým, když jeden bot změní příspěvek a jiný způsobí, že se tato změna zruší. Taha Yasseri z Oxfordského internetového institutu zkoumal toto chování v samostatné studii. Zúčastnění boti jsou prý příliš omezení, než aby byli schopni se vymanit z této souhry. „Boje mezi boty jsou mnohem trvalejší než spory mezi lidmi. Někdy to funguje roky,“ říká Yasseri. Na české Wikipedii na rozdíl od té anglické boje botů nehrají významnou roli. Podíl botů není příliš vysoký (na české Wikipedii působí aktuálně přes 30 registrovaných lokálních botů a další pečlivě prověření a schválení tzv. globální boti).

Když narazí bot na bota

Kromě toho vždy záleží na tom, v jakém prostředí budou boti používáni. Yasseri k tomu využívá příklad automobilů s autonomním řízením: stejné vozy „budou řídit v různých kulturách a prostředích, na německé dálnici i na italských silnicích“. Ale: „Dopravní předpisy jsou různé, různé jsou i zákony a kultura řízení.“ Převedeno na Wikipedii to vysvětluje rozdíly mezi verzemi v jednotlivých zemích, kdy v příslušných jazykových komunitách panují různé editační kultury. „Proto se i roboti potom chovají jinak.“

U malých jazykových verzí mohou boti provádět cenné práce při vytváření celé řady základních záznamů. Používají k tomu obrovskou databázi Wikidata. Z těchto materiálů může bot vytvořit cílené položky, jakýsi základní článek Wikipedie. V blízké budoucnosti by celé verze Wikipedie mohly být vytvořeny pouze boty. Zatímco podíl článků vytvořených boty se u známějších jazyků pohybuje kolem deseti procent, je u exotických jazyků toto číslo už nyní často mnohem vyšší. Rekordmanem je nejspíše filipínská cebuánština se stoprocentním podílem boty vytvořených článků. A co více, cebuánská Wikipedia je také formálně druhou největší na světě s více než pěti miliony položek.
Zdá se, že význam Wikidat čím dál více roste. Budete-li chtít odpovědi na znalostní otázky, poslouží vám brzy jazykoví asistenti, jako je Alexa nebo Google Home, kteří se stále více obrací na Wikidata. Knihovny a muzea nyní také propojují své katalogy s Wikidaty. Závěr výzkumného pracovníka Wikipedie Andrewa Liha zní: „Vliv Wikidat mimo platformu Wikimedia může být dokonce ještě důležitější než uvnitř.“

***

Čtyři typy Wikipedia vandalů

Wikipedia trvale trpí všemi druhy vandalských útoků. Na stránce ethicsofalgorithms.org je seznam, v němž jsou drzí nebo škodící uživatelé rozlišováni na trolly a ničitele.

Vtipálci
Trollové, kteří se velkoryse baví tím, že dělají nesmyslné změny a pokládají to za vtipné.

Ignoranti
Redaktoři, kteří opakovaně ignorují pravidla a zvyky z nevědomosti nebo tvrdohlavosti.

Sabotéři
Lidé, kteří chtějí mařit práci v projektu Wikipedia zcela cíleně.

Manipulátoři
PR lidé, kteří šíří dezinformace - z vlastního zájmu nebo na objednávku.

***

Podíl botů v největších verzích Wikipedie

Boti nejen bojují s trolly, ale mohou také vytvářet rudimentární záznamy. V rozšířených jazycích uzavírají jen některé mezery. Pro exotické jazyky, jako je filipínská cebuánština, přebírají ale téměř celou práci kvůli nedostatku autorů.

Angličtina (5,5 mil. článků) 3 %
Cebuánština (5,4 mil. článků) 100 %
Švédština (3,8 mil. článků) 82 %
Němčina (2,1 mil. článků) 0 %
Francouzština (1,9 mil. článků) 3 %
Holandština (1,9 mil. článků) 54 %
Ruština (1,4 mil. článků) 11 %
Italština (1,4 mil. článků) 8 %
Španělština (1,4 mil. článků) 13 %
Warajština (1,3 mil. článků) 90 %
Polština (1,3 mil. článků) 13 %
Vietnamština (1,2 mil. článků) 65 %
Japonština (1,1 mil. článků) 1 %
Portugalština (1,0 mil. článků) 17 %
Čínština (1,0 mil. článků) 17 %

Foto popis| „I dobří boti spolu bojují.“ Dr. Taha Yasseri Oxfordský internetový institut
O autorovi| RICHARD MEUSERS, autor@chip.cz

Příbuzná témata: