Workshop se zaměřením na archivaci a úložiště

“Vlastníte soukromou sbírku digitálních fotografií, která má pro vás určitou osobní hodnotu:

– Jste schopni najít jednu konkrétní fotku, např. z dovolené před 5 lety?

– Víte, na jakém médiu/úložišti ji máte?

– Co když úložiště selže – existuje jeho záloha?

– Máte sjednocený systém pojmenování souborů, abyste se v nich dobře orientovali?

– A co za dvacet let – stále budete tu fotku schopni najít, přečíst a zobrazit?”

Touto jednoduchou a působivou analogií uvedl svůj příspěvěk i celý workshop první přednášející, Bohuš Získal, který se dlouhodobě věnuje teorii digitální archivace a vývoji archivačních metodik, spolupracuje se sdružením CESNET a Národním filmovým archivem . Ve svém příspěvku seznámil publikum se základními principy archivace, které jsou pro všechna digitální data stejné – ať už jde o malou domácí sbírku fotografií, hudby či videí, anebo rozsáhlý, profesionálně vedený archiv televizní společnosti. Publiku spíše kladl otázky, než nabízel odpovědi – s cílem zdravě zneklidnit, aby každý o ochraně svých digitálních, z podstaty velmi pomíjivých a ohrožených dat začal vážně přemýšlet.

Druhý příspěvek přednesl Jan Zahradníček, který v posledních několika letech navrhoval a vytvářel systém digitální archivace v Národním filmovém archivu. Využil těchto zkušeností a svůj příspěvek “Příprava AV archivu” postavil na srovnání přístupů paměťových institucí a světa broadcastu, které se v řadě ohledů liší. Kromě analýzy výchozí situace (jaká data chceme archivovat, kolik jich máme), strategického plánování (jak dlouho data uchovat, v jakém počtu kopií, jak rychle mají být dostupná atd.) se věnoval především výběru formátů vhodných pro dlouhodobé uchovávání AV dat a také problematice digitalizace kinematografického filmu a videozáznamů na magnetických páskových a optických médiích.

Hlavní část workshopu vedl Tomáš Strnad, který jako systémový architekt navrhnul a spravuje řadu audiovizuálních archivů, a jeho příspěvěk tak byl velmi konkrétní a praktický. Hovořil o obvyklém schématu digitálních archivů v oblasti broadcastu, kdy primární kopie je online na diskovém úložišti a sekundární offline na LTO médiích nebo (v posledních letech stále častěji) cloudovém úložišti. Dozvěděli jsme se, v čem jsou enterprise datové pásky lepší (a proč tak výrazně dražší) než média technologie LTO. Velmi zajímavé bylo cenové srovnání LTO vs. cloud, kdy se krátkodobě vyplácejí spíše pásky, avšak z perspektivy delší než 10 let už to může být opačně. Zmíněna byla také alternativa k páskám – Optical Disc Archive (ODA) firmy SONY, dále se přednášející zamýšlel nad využitím WORM médií při archivaci, nastínil dilema TAR vs. LTFS při zápisu na pásky a řadu dalších témat.

Workshop zakončil archivář Českého rozhlasu Tomáš Bělohlávek, který ve svém příspěvku představil archiv ČRo, obsahující zvukové nahrávky staré až 100 let. Digitalizace archivu probíhá soustavně už 15 let, nyní je v digitální podobě přes 1,5 milionu hodin záznamu zvuku a přes 7,8 milionů stran písemností: Data o objemu 400 TB, jež jsou ve třech kopiích ukládána na magnetické pásky LTO. Hlavním tématem příspěvku byla alternativní archivační technologie PIQL (http://www.piql.com/cz/), kterou ČRo využil k jednorázovému uložení výběru ze svých digitalizovaných sbírek – celkem 2292 hodin záznamu zvuku, přibližně 1 TB dat. PIQL využívá optický analogový záznam digitální informace na černobílý 35mm film (stejný, jako se používal donedávna v kinematografii). Jedna téměř kilometrová role filmu má kapacitu 100 GB, což vzhledem k finančním nákladům na pořízení záznamu i k prostorové náročnosti na uložení není mnoho. Výhoda tohoto systému je samozřejmě jinde – v oblasti „deep archive“, tedy opravdu dlouhodobé archivace po desítky či stovky let bez potřeby migrace, s minimálním množstvím přístupu k datům a také s minimálními nároky na péči o média.

Cílem workshopu pořádaného společností Smart Informatics bylo přitáhnout pozornost odborné komunity k tolik důležitému, přitom stále podceňovanému tématu archivace v digitální éře.

Do budoucna bychom chtěli pokračovat v podobných setkáních, zaměřených buď na jednotlivé archivační technologie nebo samozřejmě i další oblasti naší specalizace. Budeme se těšit na Vaši případnou účast.

Pokud byste měli zájem o jednotlivé prezentace nebo pokud budete mít jakýkoliv dotaz k dané problematice napište nám na email tomas.strnad@smartinformatics.cz , rádi se s Vámi podělíme o naše zkušenosti.