Útijelentés
International Summit on a Global Registry for Digital Masters
4-5th May , 2006
Washington, D.C., USA
Moldován István
2006. május 23.
Az EROMM (European Register of Microform and Digital Masters) szervezettől meghívás érkezett az Országos Széchényi Könyvtárba egy 2006. május 4-5-én rendezett nemzetközi megbeszélésre Washingtonba, amelyen jómagam képviselhettem könyvtárunkat.
Az EROMM képviseletében Werner Schwartz szervezte a találkozót, aki egyben a Göttingeni Egyetemi Könyvtár munkatársa. A rendezvény fő céljai az alábbiak voltak:
Meghatározni a digitalizált dokumentumok (digital master record) minimális katalogizálási adatait;
Egyeztetni az EROMM és a DLF (Digital Library Federation) katalogizálási ajánlásai közötti eltéréseket - valamint;
Létrehozni egy általános digitális nyilvántartás (Digital Registry) alapjait és megbeszélni a következő lépéseket.
A rendezvényre számos európai könyvtár kapott meghívót (pl. Hollandia, Franciaország, Olaszország, Anglia), azonban Európából a meghívó, szervező német kollégán kívül csak Raf Dekeyser, a LIBER (The Ligue des Bibliothèques Européennes de Recherche) képviseletében, Rosa Maria Marcelino Galvao a portugál nemzeti könyvtárból, és jómagam, a magyar nemzeti könyvtárból voltunk jelen. A tengerentúlról amerikai kollégák voltak az OCLC, az OCLC-PICA, az RLG, a DLF, az Internet Archive, a Hardvard Egyetem és a Library of Congress képviseletében.
A találkozót előkészítendő Werner Schwartz egy előzetes kérdőívet küldött ki a leendő résztvevőknek, hogy egyeztessük a megbeszélés alapjait, kiinduló pontjait. Elöljáróban megjegyzem, hogy nem volt részletes információm az EROMM működéséről és szolgáltatásairól, valamint az eddigi szakmai előzményekről.
Az EROMM-ról megtudtam, hogy egy, főként egyetemi és szakkönyvtárakat tömörítő európai szervezet (bár számos nemzeti könyvtár is tagja), amelynek fő célja eddig egy közös adatbázis építése volt a mikrofilmre vett nyomtatott dokumentumokról (mikrofilm masters). A szervezet időközben felismerte a végbement technológiai változásokat és foglalkozni kezdett a digitalizált dokumentumokkal is. A mikrofilmezett dokumentumok mellett elkezdték nyilvántartani a digitalizált könyveket, azok képi megfelelőit (az ún. digital master példányokat) is. A 2 milliós adatbázisukban jelenleg több mint 8.000 tétel található a digitalizált dokumentumokról.
Az EROMM feltétlenül fontosnak gondolja, hogy ezek a digitalizált anyagok megjelenjenek a könyvtári katalógusokban, bibliográfiai adatbázisokban, függetlenül attól hogy nyílt vagy nem nyílt hozzáférésűek. Többek között azért mert:
hosszabb távon a digitális másolatok (digital surrogates) helyettesíteni fogják a nyomtatott eredeti műveket;[1]
így jobban lehet koordinálni nemzetközi szinten a dokumentumok digitalizálását. A digitalizálás drága, költséges tevékenység, fontos a párhuzamosságok kiszűrése. Ugyanakkor az is fontos, hogy a leíró adatok tájékoztassanak a már meglévő digitális változat minőségéről, segítsék a döntést egy esetleges újradigitalizálás esetén.
A digitalizált dokumentumok katalogizálását az EROMM dokumentumszinten, a könyvtári katalogizálási szabványok (MARC21 vagy UNIMARC) alapján kezdte el.
Az EROMM - a mikrofilmekhez hasonlóan - a képként digitalizált dokumentumok ún. első generációs változatát határozta meg és gondolja alapul venni a katalogizáláshoz. Első generációs digitalizált dokumentum alatt az eredeti példányról szkennelt/fotózott, még nem változatott, nem konvertált képi file-okat értik. A technológiai változás, a megőrzés miatt az ezekből konvertált verziókat második generációsnak, míg az elsőből felhasználási célra készített (user version) képfile-okat harmadik generációsként határozzák meg. Hangsúlyozták, hogy a bibliográfiai feltárás alapját csak az első generációs digitális dokumentumok adhatják.
A megbeszélés első napján a kérdőívben felvetett kérdéseket, alapokat vitattuk meg. Werner Schwartz hangsúlyozta, mennyire fontos a digitalizált dokumentumok - lehetőleg önálló rekordban történő - szabványos katalogizálása. Erre az is ösztönöz, hogy a számos európai digitalizálási program jelentős részében ezekről a digitalizált dokumentumokról semmilyen metaadat nem készült, alkalmanként csak egy linkként jelennek meg a hagyományos katalógusokban a nyomtatott könyv rekordjában. A jelenlévők megegyeztek abban, hogy a legcélszerűbb ezeket önálló rekordban feltárni. Többen vitatták az első generációs digitalizált dokumentumok megfogalmazását és kezelését, amely az önálló bibliográfiai leírást a digitalizált példányról készítené. Így viszont kezelhetetlenül bonyolulttá válna a könyvtári rendszerekben a digitalizált dokumentumról készített különböző formátumok leírása. A megbeszélésen a jelenlevők többsége végül arra hajlott, hogy a katalógus rekordot főként egy digitális objektumhoz, mint egy konkrét digitális példányhoz, verzióhoz kell rendelni. Abban viszont mindenki egyetértett, hogy a másik oldalról, az eredeti dokumentum részéről feltétlenül fontos a példányszintű információ rögzítése. Tudniillik az ugyanolyan kiadások különböző példányai között is lehetnek eltérések, ezért nem mindegy, hogy melyiket digitalizálták, pontosabban szólva: ez fontos, rögzítendő információ - lehetőség szerint. Az EROMM adatbázisban - számomra meglepő módon - még el nem készült művek adatait is rögzítették, így lényegében egy minimális digitalizálási projektnyilvántartást is megcéloztak. Azt ugyan nem tudtam meg, hogy mivel, hogyan biztosítják az adatok aktualizálását, bár az amerikai kollégák is problémákat vetettek fel az olyan folyamatban lévő dokumentumokkal kapcsolatban, amelyek tényleges digitalizálása leállt, vagy csak nagyon hosszú idő alatt készül el.
Az alapvetések átbeszélése után a találkozó általános céljáról azonban az alábbi izgalmas dolog derült ki. Először is a találkozó hátterében lényegében az amerikai OCLC szervezete áll[2]. Ez az RLG-vel és a DLF-fel szoros együttműködésben már elkezdte a digitalizált dokumentumok bibliográfiai szintű katalogizálását és pár hónap múlva ezek a rekordok kereshetővé válnak a WebCat katalógusban. Az OCLC és a LIBER között már folytak a tárgyalások, és aláírás előtt van egy együttműködés, amely a digitalizált dokumentumok rekordjainak cseréjét célozza az OCLC és az EROMM adatbázisai között. A minimális adatokban való MARC-szintű megegyezés éppen ehhez az együttműködéshez szükséges. Tehát küszöbön van egy olyan szolgáltatás, amely nemzetközi szinten, igazán nagy és jelentős adatbázisban tenné kereshetővé az Európában és az USA-ban már egyszer valahol digitalizált könyvek szabványos adatait.
A találkozó második napján már az elégségesen szükséges metaadatokról esett szó és a végén elkészült egy minimál változat a rögzítendő adatokról. Olyanokról, mint pl. az eredeti dokumentum példányadata, a digitalizálás dátuma, a digitalizáló szervezet, a digitalizált dokumentumért felelős szervezet (responsibility) valamint a digitalizált képfile-ok technikai adatai.
A részletes, MARC-szintű metaadatok rögzítése még sok kérdést felvet, de mindenképpen célszerűnek látszik bekapcsolódnunk egy ilyen nemzetközi együttműködésbe. Sőt a nemzeti könyvtáron kívül - lehetőség szerint - más hazai könyvtárakat is bevonni a kezdeményezésbe. Fontos tudni, hogy a nagyobb külföldi digitalizálási projektek kapcsán sokszor kerül sor számukra idegen nyelvű mű, éppen hogy magyar könyv digitalizálására. Ugyanígy alkalmanként nálunk is rögzítésre kerülhet olyan mű, amely más ország könyvtárainak érdeklődési körébe tartozhat. Werner Schwartz elmondta, az EROMM adatbázis használóitól számos esetben kapnak megkeresést, tőlük kérve adott esetben egy-egy mű teljes értékű digitális változatát. A tesztelésre kapott EROMM azonosítóval máris találtunk olyan 19. századi magyar könyvet, amelyet éppen egy németországi könyvtár digitalizált a tartalma alapján.
Jellemző, hogy az amerikai kollégák nehezen értették azt az Európában általánosabb jelenséget, hogy az itt digitalizált dokumentumokról gyakran nincs a könyvtári katalógusokban szabványos leíró adat, sőt sok esetben semmiféle metaadat.
Az EROMM szervezőjével beszélgettem a hazai lehetőségeinkről is. Mindenképpen hasznos, fontos lenne, hogy az OSZK-ban digitalizált dokumentumaink szabványos metaadatai egy ilyen nemzetközi adatbázisba is elkerüljenek. Erre jó esély van, hiszen pl. a MEK-be felkerülő, helyben digitalizált dokumentumokról szabványos, bináris USMARC rekordokat tudunk adni, kétségtelen, hogy egyes, most felvetődött új szempontok még hiányoznak ezekből. Ugyancsak fontos lenne, hogy az alakuló, minimálisan szükséges metaadat-készletet terjesztve a hazai könyvtárakban már digitalizált könyvekről is rekordokat tudjunk eljuttatni az EROMM-ba. Említettem a szervezőnek az eddigi eredményeinket és a hasonló kezdeményezéseket, mint a TEL-t vagy a Nemzeti Digitális Adattár projektet. Szelektálva talán ezekből az adatbázisokból is lehetne rekordokat közvetíteni, bár a TEL-lel kapcsolatban kissé szkeptikusnak tűnt. Próbáltak korábban együttműködést szervezni, de nem lett sok eredménye. Az EROMM egyéb kiegészítő információkat és szabványos MARC formátumot igényel, amit a TEL katalógusa nem tud biztosítani. De például éppen a portugál nemzeti könyvtár, amely mind a TEL-nek, mind az EROMM-nak is tagja, mindkét adatbázis felé küld megfelelő adatokat, mivel a bővebb, alaposabb metaadatokból megoldható egy szűkebb adatkészlet konverziója. A két kezdeményezés technológiája is eltér, hiszen míg az EROMM, egy közös katalógusnak megfelelően, MARC formában begyűjti a rekordokat, addig a TEL az OAI-PMH alapján csak "learatja" a Dublin Core formában hozzáférhetővé tett metaadatokat.
A második napi megbeszélésen kiderült, hogy a DLF-nek szintén hasonló gyakorlata van, mint az EROMM-ban tervezett digitalizált dokumentumok és -projektek nyilvántartása. Sőt a DLF ajánlása már az elsődlegesen digitális (born digital) dokumentumokra is vonatkozik, adatbázisuk azokat is tartalmazza. A megbeszélésen egyeztették is a DLF ajánlásban lévő MARC mezőket és tartalmukat az EROMM adatbáziséval. Úgy tűnik, hogy amit mi csak óvatosan próbáltunk és az európai MINERVA együttműködés csak projekt-nyilvántartás szintjén célzott meg, azt ezekben az adatbázisokban már dokumentum-szinten, szabványos MARC rekordokban elkezdték nyilvántartani.
Ajánlott honlapok, források:
EROMM
http://www.eromm.org
OCLC -WebCat
http://www.oclc.org/worldcat
Internet Archive
http://www.archive.org
The Ligue des Bibliothèques Européennes de Recherche (LIBER)
http://www.kb.dk/liber
Digital Library Federation (DLF)
http://www.diglib.org
The Research Libraries Group, Inc. (RLG)
http://www.rlg.org
Registry of Digital Masters - Record Creation Guidelines
Version 1.0. July 2004.
http://purl.oclc.org/DLF/rdm0704
http://www.diglib.org/collections/reg/DigRegGuide.htm
Global Digital Registry
Dupont Circle Recommendations for Recording Digital Masters
http://mek.oszk.hu/html/irattar/sajto/2006/globaldigreg.doc
Jegyzetek
Egy Washingtonban élő, nyugdíjas magyar könyvtáros kolléganőtől hallottam, hogy az olvasók jelentős többsége már szinte csak az online, közvetlenül elérhető digitális dokumentumokat keresi. [VISSZA] Az útibeszámoló megírása közben értesültem róla, hogy 2006. július 1-től a két nagy könyvtári szervezet, az OCLC és az RLG egyesül - http://www.rlg.org/en/page.php?Page_ID=20942 [VISSZA]