Český rozhlas má ve svých archivech skutečně unikátní historické zvukové nahrávky, které se snaží nejen zpřístupnit, ale i zachovat pro budoucí generace. Používá k tomu zajímavou technologii Piql.
Archiv Českého rozhlasu má za úkol pečovat o zvukové a písemné dokumenty z produkce Českého rozhlasu a jeho předchůdců a tyto dokumenty musí evidovat a zpřístupňovat. Archiv je skutečně často využíván, a to jak pro programové účely a webové stránky Českého rozhlasu, tak laickou i odbornou veřejností. Jde o poměrně starou instituci - archiv byl zřízen už v roce 1927 a postupně přesouval svoje sídlo z Prahy do Přerova nad Labem a zpět do Prahy. V roce 2000 zatím definitivně přesídlil do novostavby Studiového domu v Římské ulici v Praze. Archiv rozhodně není malý - jeho celková „délka“ činí asi 6 000 běžných metrů.
Digitalizace cenností
Písemnosti jsou stejně jako zvukové záznamy uloženy v analogové podobě, a to na rozličných nosičích a v různých formách. V dnešní době by tedy byly prakticky nepoužitelné, pokud by nebyly digitalizovány a zpřístupněny on-line. Proto v Českém rozhlasu od roku 2003 probíhá soustavná digitalizace veškerých archivních fondů a sbírek.
Co se týká zvukových fondů, těch je v Českém rozhlasu několik. K nejdůležitějším patří Archivní fond, který obsahuje zvukové dokumenty trvalé kulturně-historické hodnoty. Patří sem například autentické záznamy hlasů významných osobností, jako jsou projevy prezidentů, panovníků, umělců, vědců, sportovců atd., a autentické záznamy významných historických událostí. (např. Mnichov 1938, 2. světová válka, politické procesy 50. let, srpen 1968, listopad 1989). Zastoupena jsou i vynikající literární díla - rozhlasové hry, četby a pohádky.
V Dokumentačním fondu jsou zase dokumenty výhradně rozhlasové provenience, tedy hry, četby, dramatizace, pohádky, pásma, publicistické pořady a hudební snímky. O ty je samozřejmě velký zájem, protože rozhlas je může programově využít formou repríz. V Hudebním fondu jsou pak výlučně hudební snímky trvalé kulturně-historické hodnoty. Archiv ale spravuje i řadu dalších záznamů, jako je fond Rozhlasových novin (uchovává hlavní zpravodajskou relaci „Rozhlasové noviny“ od r. 1969), desetitisíce standardních gramodesek, programově-provozní materiály, zápisy z porad, korespondence, osobní spisy pracovníků, smlouvy, fotografie a negativy, technické plány, rozhlasové tisky, osobní sbírky významných rozhlasových pracovníků a další materiály.
Z uvedeného je jasné, že bylo opravdu co digitalizovat. Digitalizace byla dílem řešena externími firmami, dílem silami rozhlasu. V digitálním archivu je nyní uloženo více než 220 tisíc hodin nahrávek, což představuje přibližně 25 let zvukového záznamu a více než 7,5 milionu stránek nejrůznějších písemností. Přitom digitalizace nebyla v mnoha případech jednoduchá. V průběhu let se totiž zvuk zaznamenával na nejrůznější média (viz box na této straně).
Převod do digitální podoby
S digitalizací těchto a dalších médií se v Českém rozhlase začalo v roce 2003. Jak nám vysvětlil pan Miloslav Turek z archivu Českého rozhlasu (díky němu například rozhlas získal jediný zvukový záznam hlasu Oty Pavla nebo Alberta Einsteina), při digitalizaci se postupovalo co nejcitlivěji se snahou původní záznam zachovat a neublížit mu. Někdy se ale původní materiál při zpracování poškodil nebo rozpadl.
Jako zvukový formát byl při digitalizaci použit WAV a k žádným úpravám a vylepšením při digitalizaci nedocházelo. Zvuk je tedy autentický a zůstává na něm šum a další nedostatky způsobené tehdejším stavem techniky, ale také atmosféra a emoce. Restaurátoři upravovali zvuk pouze v případě, kdy byl poškozen nosič záznamu (poškrábaná fólie a podobně). Úspěšnost digitalizace je přitom poměrně veliká: u magnetofonových pásek téměř 100 procent, u fólií asi 80-90 procent.
Bohužel ne vše se zachovalo, a to nejen kvůli nedostatkům záznamových médií. Chybí například záznamy politických procesů z 50. let, často u uměleckých děl zasáhla cenzura (kvůli autorům nebo účinkujícím), nebo selhala technika. Z dochovaného už má Český rozhlas digitalizováno 99 procent analogových záznamů, což je úžasné číslo.
Jak pracuje digitální archiv
V digitálním archivu se nyní nacházejí všechny digitalizované analogové záznamy a průběžně se do něj ukládají i nové pořady a záznamy vysílání. Archiv funguje na softwaru Hierarchical Storage Manager (HSM) od Oraclu a na vlastním systému AIS (automatický informační systém vyvinutý pracovníky Českého rozhlasu). Záznamy jsou uloženy na diskovém poli s kapacitou 20 TB, které je doplněné páskovou knihovnou s kapacitou 400 TB. Uživatelé systému AIS mají tedy k často používanému materiálu okamžitý přístup, pokud se jedná o méně využívané dokumenty, jsou k dispozici asi do tří minut, za které je schopen robot umístit pásku do čtečky. Samozřejmě se z archivu pořizují i kopie, a to tři plnohodnotné otisky na páscích, které jsou uloženy na odlišných místech.
Český rozhlas však myslí i na budoucí generace, pro které chce nejdůležitější archivní dokumenty zachovat. Stát se totiž může cokoli - ať už přírodní katastrofa, teroristický čin, nebo jiná pohroma. Jen v nedávných dějinách se o rozhlas několikrát bojovalo.
Pracovníci archivu tedy začali hledat médium, na kterém by se daly digitální záznamy bezpečně a dlouhodobě uchovat. Všechna tradiční záznamová média, jako jsou pevné disky, SSD, optické disky a LTO pásky, totiž mají jen omezenou životnost, a navíc není jisté, zda se po mnoha letech ještě najde zařízení, které je bude schopné přečíst. Velmi rychle se totiž mění jak média (kdo si dnes vzpomene na ZIP nebo JAZ), tak rozhraní i formáty dat. Data se proto musí často přesouvat z jednoho média na druhé a to je časové i finančně nákladné.
Kujme Piqle
V digitálním světě zatím v podstatě není médium s podobnou trvanlivostí, jakou má třeba kámen, papyrus, nebo alespoň papír. V Českém rozhlasu se nakonec rozhodli pro řešení společnosti Piql. Ta, zdá se, našla paměťové médium s prokazatelnými dlouhodobými vlastnostmi. Tím je fotosenzitivní film, který se pro zachování obrazů a filmů používá už od roku 1839 a který prokázal svoje skvělé vlastnosti a odolnost. Je velice stálý, protože jde v podstatě jen o stříbro uložené na polyesterové podložce (nehořlavé). Tomuto materiálu se nemůže nic moc stát, třeba na rozdíl od barevného filmu, který obsahuje pigmenty a není tak stálý.
Nejde ale o „větší mikrofilm“, na který se ukládá analogově a který se pro archivační účely používá už dlouho. V tomto případě se totiž podařilo spojit tradiční a osvědčený materiál s moderní digitální technologií. Piql ukládá na 35mm film (označený PiqlFilm) digitální záznamy v podobě pixelů ve vysokém rozlišení (4K). Každý pixel ředstavuje dva bity (má totiž čtyři stupně šedi). Data jsou uložena bezpečně na nepřepisovatelném médiu WORM (write once, read many), což znemožňuje změnu nebo vymazání zaznamenaných dat. Po vložení do speciálního pouzdra (PiqlBox), které se snadno štosuje a přenáší, pak tento film odolá i vodě a ohni. Firma Kodak by přitom měla tento materiál vyrábět ještě dlouho.
Z filmu do počítače
Technologie Piql je podle výrobce vhodná pro všechny typy digitálních dat. Z filmu mohou být binární data zase dekódována zpět do původního souboru, podobně jako v případě jiné úložné technologie. Navíc je výhodné, že vedle digitálních dat se mohou na filmový pás zaznamenat i analogové, člověku srozumitelné informace, jako je text nebo obrázky. Stačí se tedy na film podívat pod lupou nebo pouhým okem a zjistit tak, co se na filmu nachází.
Na PiqlFilm lze navíc uložit i software použitelný pro dekódování binárních kódů, a to opět v podobě čitelné lidským okem. Jde o Open Source software v jazyku C, který snad budou schopny znovu přepsat do počítače, zkompilovat a použít i příští generace - i když už možná na úplně jiném počítači. Snadno tak z filmu vyčtou, jak získat zpět uložené soubory. A na filmovém pásu je uložen i zdrojový kód volně dostupného programu pro načtení digitálních souborů. Například pro obrázky se používají soubory ve formátu TIFF.
Pro čtení digitálních dat je sice primárně určena čtečka Piql Reader, alternativně je ale možné použít v podstatě jakoukoli technologii, která je nebo bude schopna převést uložené pixely na digitální obraz, tedy například skener, případně po optickém zvětšení třeba lupou nebo mikroskopem i třeba digitální fotoaparát. Předpokládá to tedy, že takováto zařízení budou existovat i v budoucnu.
Aktuálně je zapisovací zařízení Piql Writer schopné zapisovat rychlostí 24 políček za sekundu, tj. asi 50 MB/s. Jednotivé body osvicuje v zařízení zelené monochromatické LED světlo. Čtení pak probíhá na Piql Readeru rychlostí 2,7 políčka za sekundu, což představuje rychlost asi 6 MB/s. Český rozhlas si tuto technologii vybral i proto, že je poměrně levná. Uložení jedné minuty záznamu vyjde na korunu. A nízké jsou i náklady na údržbu a provoz. V podstatě žádná údržba totiž není potřebná a ani žádné speciální prostory pro skladování, stačí prostředí kanceláře.
Projekt pro ČRo je v ČR prvním uskutečněným komerčním projektem společnosti Piql, kterou u nás zastupuje firma Bonton. V zahraničí už tento systém používá například brazilské ministerstvo spravedlnosti, soudní dvůr v Dillí, maďarský národní archiv, chorvatský národní archiv a další. Co se týká realizace projektu v Českém rozhlasu, byly do něj v pilotním projektu zahrnuty již digitalizované zvukové záznamy v celkové délce 2 300 hodin. Šlo celkem asi o 6 000 samostatných záznamů, které byly uloženy na deset rolí filmu Piql by Kodak o délce 950 m s kapacitou 1 TB. Třeba si zvukové poklady jednou někdo s radostí poslechne.
***
Na čem se záznamy uchovávaly
> 1923: Z prvních let vysílání Českého rozhlasu, tedy od roku 1923, žádné zvukové záznamy neexistují, protože v podstatě nebylo na co zvuk ukládat. Až ve druhé polovině dvacátých let se rozvinula technologie elektrického nahrávání gramofonových desek. Točilo se do vosku a na jednu desku se vešlo cca 6 minut záznamu. Záznam byl poměrně kvalitní, ale problém spočíval v tom, že se dal v plné kvalitě přehrát jen jednou. Každá další reprodukce záznam poničila, a prakticky nic se tedy nedochovalo.
> 1932: Až v roce 1932 se začaly v rozhlasu používat zvukové fólie z celuloidu, a bylo tedy možné začít tvořit první zvukový archiv. Tyto fólie se daly přehrávat až dvacetkrát a jejich předpokládaná životnost byla pět let. Naštěstí se ukázalo, že v praxi vydrží mnohem déle -v podstatě dodnes, a proto je také bylo možné digitalizovat. Následovaly fólie želatinové (nepříliš odolné) a hliníkové s šelakovým lakem. Ty měly sice o něco horší zvukovou kvalitu, ale byly trvanlivější. V roce 1936 přešel Český rozhlas na plastové 25cm fólie (tzv. decelitky), na které se vešly tři minuty záznamu na každé straně a které prokázaly mimořádnou odolnost. Šlo o záznamové médium typu WORM, na které bylo možné jednou zapsat a mnohokrát z něj číst, takže nehrozilo nebezpečí jejich přepsání, a proto se také zachovaly dodnes.
> 1935-1955: V letech 1935 až 1955 se v Českém rozhlasu pro uchování zvuku používal magnetofon a kovový pásek navinutý na obrovském kole (viz obrázek), které bylo nepraktické. Záznam často „zmizel“ nebo se prokopíroval do další vrstvy, takže pro archiv bylo toto médium nevhodné a nic z té doby se nedochovalo. K nevýhodám patřilo i to, že se záznam nedal stříhat.
> 1940-2003: To umožnily až 6,3mm magnetofonové pásky používané od roku 1940 v podstatě až do roku 2003. Měnila se rychlost posouvání pásky, ale jinak záznam zůstal po dlouhou dobu v podstatě nezměněn. Pásek bylo navíc možné stříhat a slepovat. Šlo sice o záznam stabilní, ale bohužel pásky bylo možné opětovně použít, což se také často kvůli nedostatku nových stávalo, takže se původní záznam bohužel nedochoval. V 80. letech už se začal používat digitální záznam na datové kazety R-DAT (Digital Audio Tape), MiniDisc a další. Co se týká archivace, už od 30. let si rozhlas uvědomoval potřebu dlouhodobějšího uchování svých záznamů. Pořídil si tedy systém Philips-Miller, který zapisoval na filmový pás s šíří 7 mm. Záznam se prováděl mechanicky a reprodukoval se pomocí optiky, takže se tento pásek neopotřebovával a nedal se smazat.
***
Technologie Piql v datech
> Rozlišení jednoho políčka: 4 096 x 2 160 pixelů (4K rozlišení)
> Počet políček na pásu: 65 000
> Délka filmového pásu: 950 m
> Kapacita pásu: 115 GB
> Rychlost zápisu: 24 políček za sekundu, tj. asi 50 MB/s
> Rychlost čtení: 2,7 políčka za sekundu, tj. asi 6 MB/s
> Předpokládaná životnost: 500 let
***
Český rozhlas v datech
> Začátek pravidelného vysílání: 18. května 1923
> První zvukový archiv: 1932
> Počátek digitalizace: 2003
> Obsah digitálního archivu: 220 tisíc hodin nahrávek (25 let zvukového záznamu)
> Obsah digitálního archivu: 7,5 milionu stránek
> Uložení digitálních záznamů: diskové pole s kapacitou 20 TB, pásková knihovna s kapacitou 400 TB
> Oficiální web: www.rozhlas.cz
Foto popis| Výhodou PiqlFilmu je to, že může kombinovat analogová i digitální data. Snadno se tak i pouhým okem zjistí, co je na něm uloženo.
Foto popis| Pan Miloslav Turek z archivu Českého rozhlasu u záznamového přístroje Blatnerfon. Záznam byl magnetický a nahrávalo se na kovový pásek o šířce 3 mm, který se pohyboval vysokou rychlostí 1,5 m za vteřinu. Na ohromnou cívku s hmotností 15 kg se sice vešlo 2 700 m pásku, ale záznamová kapacita byla jen 30 minut.
Foto popis| V průběhu let se v Českém rozhlasu zapisovalo na různá média s kratší či delší životností. Nějaká je naštěstí možné použít i dnes.
Foto popis| Pro čtení digitálních dat je primárně určena čtečka Piql Reader a pro zápis zařízení Piql Writer schopné zapisovat rychlostí 24 políček za sekundu, tj. asi 50 MB/s.
Foto popis| Technika pro digitalizaci archivních materiálů.
Foto popis| Nejlépe se zachovaly záznamy na magnetofonových páscích.
Foto popis| V archivu Českého rozhlasu je 6 000 běžných metrů materiálu - zvukových záznamů, různých dokumentů, fotografií, dopisů a smluv. Většina materiálu už byla digitalizována.
O autorovi| PAVEL TROUSIL, autor@chip.cz