Zóna
A MINDENNAPI MAGAZIN
2008. szeptember 16., déli kiadás
INFO@ZONA.HU

 

Lyukak az emlékezetben: megőrizhető-e az elektronikus jelen a jövő számára?

Archiválnák a netet a digitális középkor lovagjai

szerző: Rajcsányi Gellért
2008. szeptember 15. hétfő


Mondhatjuk, hogy jelenleg azt a digitális sötét középkort éljük, amelyből nem sokat tud majd rekonstruálni az utókor.

Óceánia mindig is Kelet-Ázsia ellen viselt háborút - olvassuk az átírható múlt hátborzongató vízióját Orwell 1984-ében. Vajon a digitális világba átköltöző médiát hogyan lehet megóvni a múlt átírásától, a valóság átszínezésétől? A zóna utánajárt, lehetséges-e egyáltalán az online média archiválása, hol tart ez most Magyarországon. Nem örültünk az eredménynek.

Pedig az alapok állnak: a nyomtatott sajtó világában hosszú évtizedek óta megoldott az archiválás kérdése: az Országos Széchényi Könyvtár várbeli hatalmas épületében ott sorakoznak a lényeges hazai napilapok, hetilapok és folyóiratok köteles példányai. A könyvtár mélyén, megsárgult papírlapokon elolvasható, mit írt Kosztolányi a Nyugatba, hogyan harcolt a fasizmusért Gömbös Gyula Függetlenség című lapja, majd hogyan harcolt a titoizmus, az imperializmus és más izmusok ellen a Szabad Nép, amely aztán szabadulóművészként vált Népszabadsággá. Megismerhető és megváltoztathatatlan a nyomtatott múlt, csak egy súlyos katasztrófa tudná elpusztítani.

De hogy áll a lesajnált Gutenberg-korszakhoz képest a digitális jelen? A hírvilág, a média egésze egyre inkább az online világra tevődik át. Kézenfekvő a kérdés, hogyan lehet az internetes tartalmakat megőrizni a jövő számára, hogy a múltról szóló ismeretek ne legyenek kitéve rosszindulatú hackerek és megbízóik kényének-kedvének?

A minap a Népszabadság Orbán Viktor amerikai utazásáról szóló cikke eredetileg arról szólt, hogy a Fidesz elnöke nem találkozott idősebb George Bushsal. A Reakció magazin munkatársának viszont másnap feltűnt, hogy az online archívumban is megtalálható cikk szövege megváltozott, miközben az URL megegyezett az eredeti cikkével: itt már arról olvashattunk, hogy Orbán Viktor mégis találkozott az exelnökkel. Az Index Pufajkás Turul rovata pedig beszámol arról, hogy Gusztos Péter SZDSZ-es képviselő úgy archiválta honlapján elnökválasztási kampánybeszédét, hogy kivette belőle vesztes jelölt, Kóka János támogatására utaló beszédrészleteket.


A Pocok-workshop és társai

Hazánkban ma két intézmény foglalkozik a média egy-egy szeletének digitális archiválásával. A Magyar Elektronikus Könyvtár (MEK) az Országos Széchényi Könyvtáron belül működik, ez az intézmény az elektronikus publikációk összegyűjtésére, katalogizálására és hosszú távú archiválására jött létre 1994-ben. A Nemzeti Audiovizuális Archívum (NAVA) pedig a magyar nemzeti műsorszolgáltatói kötelespéldány-archívum, amely az országos földfelszíni terjesztésű televíziók és rádiók magyar gyártású vagy magyar vonatkozású műsorait gyűjti, tárolja, dolgozza fel, és az így létrejövő adatbázisban keresési és megtekintési lehetőséget biztosít. A NAVA és a MEK egyik közös vonása, hogy vezetőik a kilencvenes évek első felének hazai internethőskorszakától kezdve bábáskodnak projektjeik körül.

Moldován Istvánnal a várbeli OSZK labirintusszerű alsó traktusában találkoztunk. Néhány tágas teremben itt működik a Magyar Elektronikus Könyvtár, amelynek könyvtárosként ő az egyik alapítója. "1993 körüli az élmény, amikor is a Nemzeti Információs Infrastruktúra-fejlesztési Programban megismertük az internet organikusan fejlődő, dinamikusan változó hálózatát. Rájöttünk, hogy nekünk, könyvtárosoknak az internetes archiválással is foglalkoznunk kell" - emlékszik vissza a kezdetekre. Az 1994 tavaszán tartott "Pocok-workshop" alatt néhány lelkes könyvtáros elhatározta, hogy ajánlást készít a Magyar Elektronikus Könyvtár megalapításához és működéséhez. A MEK 1999-ben vált az OSZK részévé, addig szinte csak társadalmi munkában fejlesztették az ügy iránt elkötelezett szakemberek.

Kovács András Bálint, a NAVA szakmai igazgatója a Millenáris Park egyik épületében található főhadiszálláson beszélt a zónának az archívum hosszú vajúdásáról: "Az ötlet már 1995-ben megfogalmazódott, de alapvető elképzeléseinket 1999-ben öntöttük formába. Bevallottan a francia Nemzeti Audiovizuális Intézet (INA) volt az előképünk, de meg kellett találnunk a hazai viszonyokra alkalmazható intézményi formákat" - mondja az igazgató. Az akkoriban futurisztikusnak tűnő projekt csak hosszas előkészítés után valósulhatott meg: minden érintett kormányzati szereplőt meg kellett győzni a terv fontosságáról, ami persze nem volt egyszerű feladat. "A tévécsatornák is enyhe távolságtartással fogadtak minket, hogy mit is akarunk az ő anyagaikkal. De ma már teljesen korrekt a kapcsolatunk velük" - mesél a kezdeti nehézségekről a szakember. Végül 2006 januárjában indult el a NAVA, ekkortól archiválja a legnagyobb hazai televíziók (MTV, Duna Televízió, RTL Klub, TV2) és rádiók műsorait.


Meddig nyúlik a takaró?

A két intézmény megléte már önmagában örvendetes, de a mostani feltételek közepette csak erősen korlátozottan tudnak archiválni. A kereskedelmi tévék 1997-ben indultak, de a NAVA visszamenőlegesen csak külön projektek esetében archivál. Az RTL Klub és a TV2 első kilenc évének műsorfolyama nagyrészt elveszett. Az MTV viszont elkezdte saját, ötven évre visszatekintő archívumának digitalizálását. Össze is fogtak a NAVA-val, ám kiderült, hogy a mostani kapacitással 34 évig tartana a teljes feldolgozás és rendszerezés, ezért leálltak a kezdeményezéssel.

A MEK is a szűkös kapacitásokkal küzd, ahogyan Moldován István tömör megfogalmazásából is kiderül: "Minél gyorsabban változik egy-egy oldal, annál nehezebb az archiválás." Jelenleg csak statikus oldalakat tudnak elmenteni, lezárt lapokat archiválnak. A MEK a klasszikus könyvtári feladatok digitális verzióját végzi: az online megjelenő folyóiratokat, könyveket archiválja úgy, hogy a mentett anyagok egységes formátumot kapnak. Orwelli veszélyei azért vannak ennek is: az internetes tartalom archiválásakor meg kell küzdeni a különféle programnyelvekkel, formátumokkal, miközben nemcsak a megőrzés, hanem a hiteles megőrzés a fontos.

Az 1984 kételyeire a NAVA-nál is rákérdeztünk, Kovács András Bálint viszont biztos a védelemben: "Állítom, hogy a NAVA a legbiztonságosabb webes környezetek egyike. Senki sem képes hozzáféni és valamilyen módon manipulálni a felvételeket. Azok ráadásuk három (nemsokára két) példányban lesznek archiválva: szervereken és mindentől elzárt mágneses adatszalagokon tároljuk a felvételeket - sorolja a biztonsági feltételeket. - A harminc év garanciával ellátott szalagokról tíz év után másoljuk át, vagyis migráltatjuk a tartalmat egy újabb szalagra. Az archívum minden egyes felvételének minden egyes felhasználása nyomot hagy maga után, így lehetetlen, hogy valaki észrevétlenül hozzájuk férjen, és manipulálja ezeket a felvételeket." A folyamatosan érkező adattömeg tárolása sem egyszerű feladat: évente ötven terabyte (ötvenezer gigabyte) memória telik meg - ez nagyjából huszonkétezer óra műsoridőt töltene ki.

A szakértők a digitális archiválást csakis állami feladatként tudják elképzelni. A Magyar Elektronikus Könyvtár egyrészt betagozódott az OSZK-ba, másrészt közhasznú egyesületet is létrehoztak. A NAVA közgyűjtemény, költségvetési forrásból működik, bár a gazdaminisztériumok többször cserélődtek az elmúlt jó két évben.

A vezető tévécsatornák archiválása tehát megoldottnak tűnik, de az új média világában nincs idő az elégedett hátradőlésre, hiszen itt a digitális televíziózás korszaka. Kovács András Bálint szerint a közeljövőben nem szűnik meg a NAVA feladata. "Hiába az online média térnyerése és a digitális televíziózás elindulása: a klasszikus műsorszolgáltatás becsléseink szerint még tíz évig biztosan nem fog megszűnni Magyarországon." A videó, a szöveg, a hangfelvétel és egyéb tartalmak összeolvadása úgy állítja egyre nehezebb feladat elé az archiválókat, hogy az eddigi tartalmakra sem sikerült még megfelelő módszert kitalálni.


Mi a MIA?

A hosszú küzdelemmel létrejött intézmények mellett megtaláltuk azt az embert is, aki szinte egyszemélyes munkával elkészítette a Magyar Internet Archívum (MIA) tervezetét. Drótos László, aki az OSZK könyvtárosaként a MEK kialakításában is részt vett, lelkesen üdvözölte a sajtóérdeklődést. Szerinte a MIA megvalósulásának első számú akadálya, hogy nincs benne ez a téma a köztudatban, mert az illetékesek nem érzik ennek a fontosságát. "Biztos, hogy más országokhoz hasonlóan egyszer majd lesz magyar internetarchívum, csak addigra már több évtizedet elveszítünk a digitális kultúránkból a késlekedés miatt, amit majd egyszer nagyon sajnálunk" - állítja a könyvtáros.

Drótos László szerint a kötelespéldány-törvény módosításával egyértelműen definiálni lehetne azt, hogy mi tekinthető online kiadványnak, amelyre nézve az előállítóiknak és a nemzeti könyvtárnak kötelezettségei vannak. Ez a tényleges webes tartalomnak csak kis töredéke lenne. A többi tartalomra az önkéntes archiválás (voluntary deposit) lehetőségét kellene biztosítani, vagyis az előállító vagy szolgáltató beadhatná egy nemzeti archívumba a digitális tartalmat, ha ezt fontosnak gondolja. Az interneten elérhető aktuális tartalmakról reprezentatív metszetek készíthetők, és ezek hosszabb távon megőrizhetők és visszakereshetők, olyan időbélyegekkel és ellenőrző összegekkel (checksum) ellátva, amelyek a hitelességüket is biztosítják.

Moldován István a kötelespéldány-törvénnyel kapcsolatban a zónának megjegyezte, hogy az OSZK kísérletet tett a törvény módosítására, az online média bevonására: "Ez azonban nem sikerült, a minisztérium visszaküldte, mondván, már benne van, szerezzünk neki érvényt."

Hogyan működik az archiválás a gyakorlatban? Alapvetően kétféle technika van: válogatva egyedi mentéseket csinálnak, vagy nagyméretű, válogatás nélküli aratásokat (harvesting) végeznek. Drótos László szerint mindkettőnek van előnye és hátránya, és mindkettővel érdemes foglalkozni. A mentések számát a frissülés gyakoriságához lehet igazítani.

Külföldön már vannak működő kezdeményezések, amelyek az online világ archiválásával foglalkoznak. Üzleti vagy nonprofit alapon szerveződött vállalkozások, egy vagy több könyvtár részvételével vagy egy célszervezet létrehozásával (mint a NAVA) működő állami projektek és vegyes modellek is elindultak. Drótos László az 1996-ban indult ausztrál Pandorát, Moldován István és Kovács András Bálint pedig az amerikai Internet Archive-ot említi példaként. A téma azonban mindenhol gyerekcipőben jár. Drótos szerint nem maga a tényleges archívum üzemeltetése az igazán nagy feladat, hanem az egész rendszer kitalálása: kik, mit, hogyan, mi célból, milyen módszerekkel archiváljanak, és ez az archívum milyen szolgáltatásokat milyen jogi keretek között nyújtson? Sok helyen még ezeknek a kérdéseknek a megválaszolásával foglalkoznak, különböző modelleket kipróbálva.

A MIA azonban még csak papíron létezik. Sőt - ahogyan Drótos László megfogalmazta - "Magyarországon nem áll jól ez a téma: még a szakmai vita, a válaszok keresése, a nemzetközi szervezetekhez való csatlakozás és a rendezvényeiken való részvétel sem indult el, pedig ez az előkészítő munka is több évet igényel, mielőtt egy valóban hasznos archívumot el lehet indítani". Drótos sok tapasztalatot szerzett egy erre vonatkozó pályázaton is: "A NIIF (Nemzeti Információs Infrastruktúra Fejlesztési Program) tavaly beadott egy projekttervet az első néhány évre az Új Magyarország programhoz, és a bírálók lényegében azzal utasították el, hogy ilyesmire nincs szükség. Ezt megelőzte egy kerekasztal-beszélgetés néhány hazai tartalomszolgáltató és más érintett szerv között, és ott is az derült ki, hogy az OSZK-n és az NIIF-en kívül mást nem igazán érdekel ez a téma." A szakembert viszont ez sem tudta eltántorítani terveitől: készített egy nem nyilvános magán-MIA-t az elmúlt években, hogy megmentsen néhány fontos site-ot, de mióta elfogyott a tárhely, azóta azzal is leállt.

Drótos szerint az riaszthatja el a döntéshozókat, hogy nem akarnak egy újabb költséges állami intézményt a nyakukba venni, pedig a MIA idővel önfenntartó lehetne: "Be kellene vonni tőkeerős internetes cégeket, hiszen nekik is érdekük, hogy az internetnek ne csak jelen ideje legyen, hanem múltja is." Kérdéses, hogy a NAVA mintát adhat-e a netes archívumnak? Az archívum vezetője reménykedik: "A MIA nem működhet teljesen a NAVA mintájára, de ahogy a NAVA-hoz a törvényi, költségvetési és műszaki hátteret sikerült megvalósítani, az azt jelzi, hogy a MIA-hoz sem lenne reménytelen ezeket megteremteni, csak akarnia kell minden érintettnek."


A digitális középkor sötétje

Az archiválás hiánya miatt már most is rengeteg tartalmat elvesztettünk a magyar internet és a kereskedelmi televíziózás hőskorából. Moldován István úgy véli, hogy az internetnek most csak jelene van, de múltja nincs. Drótos László szerint folyamatosan tűnnek el fontos tartalmak, teljes webhelyek vagy csak felületek (ugyanis a dizájn is fontos archiválandó érték, nem csak a tartalom): "A digitális kultúra nem megfogható, nincs fizikai megjelenése, és mindig van bőven alternatíva, ha eltűnik valami. Nem érezzük annyira veszteségnek, mint ha például egy könyv utolsó példánya odavész egy tűzvészben."

A NAVA most azon van, hogy a nagyközönségnek is hozzáférhetővé tegye archívumát. Kovács András Bálint a zónának elmondta: "Egy része már kísérleti jelleggel júliustól ingyen, majd januártól részben fizetősen érhető el az interneten. Az archívum teljes tartalma három éve folyamatosan hozzáférhető a NAVA-pontokban."

A jövő megjósolhatatlan, riportalanyaink azonban szívesen elmélkedtek róla: a NAVA szakmai igazgatója a távoli jövőt úgy képzeli el, hogy valahol egy szoba sarkában dolgozik egy gép, és az lesz a NAVA. "Senki nem fog dolgozni az intézménynél, legfeljebb valaki néha ránéz a gépre, amely hang- és képfelismerő programjaival magától rendszerezi a műsorokat. De ez még nagyon távoli dolognak tűnik ma." Drótos László szerint húsz-harminc évre előre semmit nem lehet mondani: a web sem látszott még a kilencvenes évek elején. Az iparág véleményformálói a mindenütt jelen levő (ubiquitous) web 4.0 verziót vizionálják, ahol már minden eszköz folyamatosan és szinte észrevehetetlenül kommunikál egymással és az emberekkel, és ahol a világ minden információja digitális lesz. "Ha a hologramalapú háttértárak elterjednek, akkor valóban elképzelhető lesz, hogy minden digitális dokumentum minden korábbi állapota megőrződjön, így az eszközök önmaguk archívumai is lesznek egyben" - avat be a futurisztikus elképzelésekbe a MIA atyja.

De addig még le kell futnia néhány billió algoritmusnak a világhálón. Drótos László fanyar humorral von párhuzamot a történelem más korszakaival: "Az ókor vagy a korai középkor írott kultúrájából is csak töredékek maradtak ránk, úgyhogy mondhatjuk, hogy jelenleg azt a digitális sötét középkort éljük, amelyből nem sokat tud majd rekonstruálni az utókor."