3. RÉSZ - TECHNIKAI KÖVETELMÉNYEK Összefoglalás Témakör Ez a fejezet lefedi a digitalizációs eljárások által felvetett problémákat; beleértve a kormány kezdeményezéseit, a tervezést, a szerzői jogkezelést (IPR), a fájlformátumokat, a hardver- és szoftverigényeket, a forrásleírásokat, a képek védelmét, a munkafolyamatokat, a költségeket, a munkaerő-szükségletet, a hozzáférési lehetőségeket, az értékelést, a karakterfelismerést (OCR-t). Stratégiai kérdések A hagyományos anyagok digitalizációja - nyomtatott dokumentumok, képek stb. - egy olyan támogatott tevékenység Európa szerte, amely a a digitális kulturális örökség létrehozására és megőrzésére törekszik és ez egy lényeges közreműködés az eEurópához. A könyvtárak egyre azon dolgoznak, más 'közgyűjteményekkel', így múzeumokkal, galériákkal, hogy digitalizált dokumentumokat hozzanak létre , és felhasználóik számára széleskörűen elérhetővé tegyék azokat. Ez a lakosság minden rétegének hasznos lehet. A digitalizációs programok fejlesztése lehetőségeket kínál a nyilvános könyvtárak számára, hogy elérjék azokat a polgárokat is, akik korábban nem használták szolgáltatásaikat, és különösképpen bátorítsák a lakosságot, hogy váljanak aktív, gyakorlott résztvevőivé és használójává napjaink behálózott világának. Bizonyítható, hogy ebben az új világban a tartalombirtoklás, és az új tartalmak létrehozásának képessége a fejlődés kulcsa. Az olyan kérdések, mint összetettség, skálázhatóság (nagy tömegek esetén használatos) és fenntarthatóság (hosszútávú megvalósítás és beruházási érték) okán egyre nyilvánvalóbbá válik, hogy a jövőben szükséges lesz megtervezni és megalkotni a nyilvános hálózati információs szolgáltatásokat, legalább nemzeti alapokon. Az ilyen szolgáltatások tervezése néhány országban (pl. Dánia, Anglia) előrehaladott állapotban van. Gondoskodni kell, hogy a nyilvános könyvtárak teljes egészében részt vegyenek ezekben a fejlesztésekben, digitalizált gyűjteményeik rendkívül fontos hozzájárulói lesznek a nemzeti digitalizált örökséghez.Gyakorlati javaslatok A digitalizációs munkafolyamat addig egyszerű, amíg egy olcsó PC-t és szkennert használnak egy átlagos egyszerű szoftverrel, és így készítenek digitalizált másolatot bármely emberi olvasatú műről. Amikor azonban a kapott anyag minősége is előtérbe kerülő probléma, akkor a tárolt formátum, annak a leírása, a jövőbeni használata és megőrzése is szóba kell, hogy kerüljön, így a munkafolyamatok máris összetettebbé válnak. Az alapvető munkafolyamatok egyszerűsége vezetheti a döntéshozókat és a tapasztalatlan felhasználókat téves meggyőződéshez, miszerint a digitalizációs program egyszerű és olcsó. Egyik sem igaz. Mindenekelőtt a digitalizációs programnak jól tervezettnek kell lennie, és kezdetektől a végéig hozzáértően kell irányítani. A digitalizált anyagok végfelhasználók számára elérhetővé tétele egyszerű, amíóta az Internet és a World Wide Web fejlődése biztosítja ehhez a szükséges infrastruktúrát, szoftvert és technikai szabványokat. Mindaználtal a Web nagyon könnyű hozzáférhetősége néhány alapvető problémát is rejt. Például, ha a képeket nem akarjuk szabadon hozzáférhetővé tenni, akkor összetett eljárások, bonyolult szoftverek kellenek megvédeni az állományt az illegális másolóktól. Ezen felül, mihelyst nagyszámú kép gyűlik össze, a fő probléma máris a gyűjteményszervezés - csakúgy, mint egy könyvtárban, ahol gondoskodni kell arról, hogy a könyvek a polcon valami fajta rendben legyenek, így a digitalizált képeket kategorizálni kell valamint szabványos terminológiával leírt formában kell tárolni annak érdekében, hogy az egyes képeket a használók megtalálhassák. Jövőbeni feladatok A nyilvános könyvtárakban történő digitalizáció jövőbeni feladatai erősen függenek a felvetődött kérdésekre adott válaszoktól. Különösképpen a szabványok minél szélesebbkörű elfogadásában való együttműködés teszi lehetővé a gyűjtemények közötti átjárhatóságot.. Az ideális az lenne, ha a felhasználó keresni tudna bármely digitalizált képre és azonnal meg is nézhetné, letölthetné és használhatná a képet függetlenül a fizikai tárolás helyétől vagy az aktuális gépbeállításoktól. Ez magában foglalja nemcsak a technikai szabványok elfogadását, hanem a jogi kérdések összeegyeztetését is. Témakör Témák, amellyel ez az útmutató foglalkozik: Stratégiai kérdések A "hagyományos" dokumentumok digitalizációja - nyomtatványok, képek stb. - Európa szerte támogatott folyamat annak érdekében, hogy megragadjuk és létrehozzuk a digitális kulturális örökséget. Ebben az útmutatóban a hangsúly a képek digitalizációján van (beleértve a hagyományos szövegek képeit), de a leírtak többnyire alkalmazhatóak más digitalizált objektumra (például audió fájlokra) is. Kormányprogram kezdeményezések Európában, egyezség született arról, hogy a digitalizáció stratégiai lehetőségeket kínál ezért azt intenzíven folytatni kell. Az Európai Közösség kimondta, hogy a jövőben össze fogja hangolni ezt a létfontosságú tevékenységet. . Példaképpen elmondták, hogy a digitalizáció egy fontos, első lépés a digitális tartalom fejlesztésében, amely megalapozza a teljes digitális Európát. Létfontosságú tevékenység Európa kollektív kulturális örökségének megőrzése, amelyehez a lakosok is hozzáférhetnek, erősíti ezzel az oktatást és a turizmust, és fejleszti az e-tartalmú ipart. Kulcs szerepét felismerték a 2002-es eEurope Action Plan-ben is (http://europa.eu.int/information_society/eeurope/action_plan/pdf/actionplan_en.pdf), amelyet Feira-ban, 2000 júniusában az EU tagállamok összejövetelén az Európai Tanács támogatott. Ez a digitalizációt az eEurópa koncepció (http://europa.eu.int/information_society/eeurope/index_en.htm) kivitelezésének középpontjába helyezi. Ez meghatározó irány a digitális tartalom kialakításában (http:// europa.eu.int/information_society/eeurope/action_plan/actionplantext/stimulate_use/econtent/index_en.htm). Mérföldkőnek számít egy találkozó a svédországi Lundban 2001. áprilisában, ahol megegyeztek abban, hogy kívánatos és szükséges a nemzeti kezdeményezések összefogása. Megállapították, hogy a 'digitalizáció kulcstevékenység az európai egyedülálló örökség kiaknázásában és támogatja a kulturális különbözőséget, az oktatást, és a tartalomipar nemzedékét. Noha a tagállamok beruházással támogatják kulturális örökségükhöz való hozzáférést, de még sok akadály van ezen kezdeményezések közeli és hosszú távú sikereihez. Ezek az akadályok magukban foglalják a digitalizációs eljárások változatosságát, a helytelen technológiák és nem megfelelő szabványok összekapcsolásának kockázatát, a hosszú távú megőrzést és hozzáférést a digitális objektumokhoz, ezek szerinti feladatmegosztást, a szerzői jogok (IPR) betartásában való következetlenséget, és az összhang hiányát a kulturális és az új technológiai programokban. A lundi találkozó azt a következtetést vonta le, hogy ezeket az akadályokat le lehet győzni, és az eEurope Action Plan céljait (http://europa.eu.int/information_society/eeurope/action_plan/pdf/actionplan_en.pdf) lehetne fejleszteni, ha a tagállamok:
A lundi találkozó alkalmával az alapelvekben megegyeztek és más háttér dokumentumok is hozzáférhetők a CORDIS-on (http://www.cordis.lu/ist/ka3/digicult/lund_principles.htm), az EK hivatalos honlapján. A nemzeti oldalakon, - további forrásokkal - is elérhetőek, például a The People Network.(http://www.peoplesnetwork.gov.uk/content/technical.asp) . Megemlítendő:
Gyakorlati javaslatok A digitalizációs munkafolyamat addig egyszerű, amíg egy olcsó PC-t és szkennert használnak egy átlagos egyszerű szoftverrel, és így készítenek digitalizált másolatot bármely emberi olvasatú műről. Amikor azonban előtérbe kerülő a kapott kép minősége, , a tárolt formátum, annak a leírása, a jövőbeni használata és megőrzése is szóba kell, hogy kerüljön, így a munkafolyamatok máris összetettebbé válnak. Az alapvető munkafolyamatok egyszerűsége ahhoz a téves meggyőződéshez vezetheti a könyvtárosokat és a döntéshozókat, hogy a digitalizációs program egyszerű és olcsó lesz. Egyik sem igaz. A digitalizált anyagok továbbítása viszonylag egyszerű, amióta az Internet és a World Wide Web fejlődése biztosítja a szükséges infrastruktúrát, szoftver és technikai szabványokat . Mindaználtal a Web nagyon könnyű hozzáférhetősége néhány alapvető problémát is problémát rejt. Például, ha a képeket nem akarjuk szabadon letölthetővé tenni, akkor összetett eljárások és bonyolult szoftverek kellenek, hogy megvédjék az állományt a szerzői jogok megsértésétől. Fontos tudni, hogy a digitalizáció gyakran csak az eredeti digitális képeinek létrehozását jelenti. Sokkal összetettebb eljárások keresik a szöveg (kép, vagy bármi) jelentését is - ahogyan az optikai karakter felismerés (OCR) -, amelyek szintén használatosak és a továbbiakban ismertetésre kerülnek. Először is tisztázni kell, hogy miért fontos a digitalizáció, szükséges a kiválasztási feltételek és a célközönség pontos kiválasztása. Megjegyzendő, hogy sem ezek a kérdések, sem a technikai problémák nem előzhetik meg egymást, ezek mindegyike alapvető egy sikeres projekthez. A következőkben el kell dönteni, hogy mit kellene digitalizálni. Lásd továbbá a különböző kulturális tartalom fejezetet. Például egy ilyen digitalizációs kiválasztási feltétel látható a Californiai Egyetemen Kritérium kiválasztás a digitalizációhoz (http://www.library.ucsb.edu/ucpag/digselec.html) címmel. Lee (lásd alul) összegzi a szükséges kérdéseket és javaslatokat a 'döntési mátrix' használatához. Colet 'Planning an Imaging Project' műve (http://www.rlg.ac.uk/visguides/visguide1.html) ugyancsak hasznos forrás lehet. A projekt területet is óvatosan kell elbírálni - könnyű alábecsülni a hagyományos anyagok digitalizációjához szükséges erőfeszítéseket, és szinte elkerülhetetlen, hogy a teljes gyűjteménynek csak részei legyenek feldolgozva. Költség, munkaerő és más kérdések (lásd lejjebb) fognak közreműködni ezekben a döntésekben. Szerzői jogok (IPR) (lásd még copyright) Ehhez két szempont:
A digitalizálási eljárás végeredménye egy kép vagy más információs objektum digitális formában. Mivel nagyon sokféle formátum használatos, gondosan kell megválasztani azt. Figyelembe kell venni, hogy rendszerint meg kell tartani az eredeti és a terjesztésre szánt másolatokat, és ezeket gyakran célszerű különböző formátumban tartani. Az általános formátumok, amiket digitalizációra használnak azok a TIFF (magas minőségű mintákra) és JPEG vagy GIF (szolgáltatható másolatokra), de ne felejtsük, hogy rengeteg verziója van ezeknek a formátumoknak. A következő kritériumra kell tekintettel lenni (C. W. Brown és B. J. Shepherd írásai alapján, a 'Graphics File Formats, Reference and Guide'. Greenwich, Connecticut, USA: Prentice Hall, 1995, valamint ahogyan le van írva a Franziska Frey 'File Formats for Digital Masters' című munkájában az amerikai Guides to Quality in Visual Resource Imaging sorozatban - http://www.rlg.ac.uk/visguides/visguide5.html). Ámbár sok formátum van, a célnak igazán kevés felel meg. Érdemes példát venni más projektekből, vagy szakértői segítséget igénybe venni. Digitalizációs hardver és szoftver A hardver széles körben választható.
Nem képi dokumentumnál, mint az audio felvételeknél, külön felszerelést kell beszerezni a digitális másolat elkészítésére. A digitalizáló szoftver beszerzésénél körültekintően kell eljárni. Három szempontot kell figyelembe venni, szkennelés, felismerés és publikálás - az utolsóra ezek közül később külön kitérünk. Képdigitalizáló szoftvert gyakran a hardverrel együtt adják, ami jó megoldás lehet. Támogatnia kell az általános szabványokat (pl. TWAIN) és olyan alapvető lehetőségeket kell nyújtania, mint a képelőnézet - ezek biztosítanak beállításokat a teljes szkennelés nélkül is. Természetesen az általunk kiválasztott fájlformátumot támogatnia kell. A képkezelő szoftver választása az egyszerűtől a kifinomultig a felhasználási szándéktól függ. Egyik lehetőségként a projektben résztvevők úgy is dönthetnek, hogy nem csak képeket digitalizálnak. Egy másik projektben dönthetnek úgy, hogy a digitalizált képekről eltávolítják a karcolásokat és a foltokat, amelyek az eredeti képen rajta lehetnek, és manuálisan beállítják a színkiegyenlítődést is stb. A megfelelő hardver és szoftver kiválasztást más megfontolások is befolyásolják, ideértve a beszerzési, és fenntartási költségeket, a használat egyszerűségét (szükséges-e külön tanfolyam), teljesítmény követelmények, alkalmazhatóság és méret, egyéb lehetőségeket (minőség és a végeredmény formátumának megválasztása), szabvány kompatibilitás, megbízhatóság és így tovább. Lényeges, hogy a digitalizált anyag rendesen katalogizálva legyen, és a megfelelő metadatok elérhetőek legyenek. A könyvtárosoknak ismerniük kell mind más szakterületek katalogizálási szokásait, (ilyen a levéltárosok által használt Encoded Archival Description (EAD)), mind az elektronikus környezetben előforduló metaadatokat (különösképpen a Dublin Core-t). Lee bővebben kifejti és útmutató található ezekben a kérdésekben az UK NOF-DIGITISE 'Technical Standards and Guidelines' című munkában. Lásd még forrás leírás résznél. Azon kívül a leíró adatokhoz szükséges lehet fejleszteni vagy alkalmazni a nyelvi sémákat, földrajzi helyszíneket, jogokat, besorolást, verziót és oktatási szintet. Ezalatt két fontos dolgot kell figyelembe venni:
Lásd még copyright. Cégen belül, vagy külső kivitelező? A legalapvetőbb kérdés a munkát illetően, hogy cégen belül, vagy külsőssel oldják-e meg. Helyi körülmények esetén szükséges lehet a munkához bizonyos előképzés, de a következő szempontokat figyelembe kell venni. Cégen belüli megvalósítás előnyei:
Külső forrás előnyei:
Átfogó dokumentum áll rendelkezésre, ha a döntéshozók a külső forrásokat készülnek megvizsgálni: 'Document Managemenet Guide and Directory: (http://www.cimtech.co.uk/) a comprehensive guide to document management and comprehensive directory of products and services for imaging and document management' 11. kiadás 2000. ISBN 0-9537954-0-3, ISSN 1366-6584. Általános munkafolyamat A digitalizációs eljárásoknál minden munkafolyamatot körültekintően kell megtervezni. Lee ebben a témában részletesen ír. Költségek Nem lehet általános költségbecslést adni, mivel az túl sokféle és bonyolult összetevőkből áll. Gould és Eblon kiszámolta egy világméretű felmérés alapján 1999-ben, hogy az átlag digitalizációs költség laponként 7,72 USD (0,12-től 15 USD-ig változó), könyvenként átlag 70,66 USD (28-tól 154 USD-ig terjedő skálán) és folyóirat számonként 14 USD (14 USD körüli összegekkel). S. Tanner és J. Lomax-Smith tanulmánya (http://heds.herts.ac.uk/resources/papers/drh99.pdf) a költségekről hasznos tanácsot nyújt. Alkalmazottak Néhány szerencsés könyvtár, hozzáértő személyzettel rendelkezik, de soknak a digitalizációhoz szükséges tudnivalókat meg kell tanulni. Megjelenítési felületek A legáltalánosabb megjelenítési felületként napjainkban a World Wide Web használatos. A könyvtárak elkészíhetik a saját weboldalukat, amelyet helyben, vagy külsőssel szolgáltatnak. Rendszerint a képeket legjobb adatbázisban tartani. A nagyobb gyűjtemények számára azonban, ahol a metaadatok, vagy más követelmények összetettek, egy speciális szoftvercsomag lehet a jobb. (Lásd például az inVisage-t (http://www.talis.com/products/infdelserv/invisage.htm) az iBase-től (http://www.ibase.com/site/home.html), amelyet most árusít a könyvtári rendszerek szállítója, Talis (http://www.talis.com/default.htm) Értékelés A kép minőségének értékelése (a nem vizuális dokumentumokkal egyetemben) ismét elég bonyolult kérdés, amely szakértő bevonását igényli. Ajánlott átnézni a szakirodalmat, mint például Franziska Frey művét a 'Measuring Quality Of Digital Masters' (http://www.rlg.ac.uk/visguides/visguide4.html), az amerikai Guides to Quality in Visual Resource Imaging sorozatból. Az optikai karakterfelismerést (OCR) sok könyvtár használja a katalóguskártyákés egyéb elsődleges tartalom digitalizálására. A modern szoftverek alkalmasak a gyengébb minőségű eredetiek megfelelő felismerésére, ennek ellenére szükséges az emberi ellenőrzés is. Nyilvánvalóan, ha meg kell őrizni az eredeti elrendezést - úgy, mint a szöveg zónák és a táblázatokban a szöveg elrendezés közötti összefüggések - akkor a feladat tovább bonyolódik. A általános szövegfelismerő csomagok között vannak, amelyek a könyvtárak számára is megfelelőek például a Scansoft OmniPage Pro (http://www.scansoft.com/omnipage/) és az ExperVision TypeReader Pro (http://www.scanhelp.com/288int/expervision/exper-homeindex.html ) programjai. A korszerűség a nyilvános könyvtárakban nagyon változó. Néhányan működtetnek, és magas szintű digitalizációs programokat folytatnak. Másoknak nincs ezzel kapcsolatban tapasztalatuk. A lehetőségek tárháza kínálkozik megosztani a szaktudást, és megfelelően alkalmazni azt. A nyilvános könyvtárakat Európai szinten bevonják a tárgyalásokba, és résztvehetnek a műhelymunkákon és konferenciákon. A legtámogatottabb programok a DGXIII-ba esők és a kulturális örökség programok. Kevesebb azon példák száma Európa szerte, ahol a könyvtárakat más területekbe vonnák be (mint például az oktatás). Világszerte nagy összegeket fordítanak a digitalizációs programokra. Az amerikai könyvtárak élenjárók ebben (lásd Linkek). Jövőbeni feladatok A nyilvános könyvtárakban történő digitalizáció jövőbeni feladatai nagyban függenek a felvetődött kérdésekre adott válaszoktól (lásd feljebb). Különösképpen a szabványok sokkal szélesebbkörű alkalmazása hozhat létre együttműködést, amely biztosíthatja a gyűjtemények közötti átjárhatóságot. Az ideális az lenne, ha a felhasználó keresni tudna bármely digitalizált képre és azonnal meg is nézhetné, letölthetné és használhatná a képet függetlenül a fizikai tárolás helyétől vagy az aktuális gépbeállításoktól. Ez nemcsak a technikai szabványok elfogadását foglalja magában, hanem a jogi kérdések összeegyeztetését is. A ezen a területen lévő technikai fejlesztések (a) leginkább az egyre olcsóbb modern szkennerekre és digitális kamerákra re, valamint (b) az átjárhatóságot lehetővé tevő szabványok nemzetközi egyezményeire összpontosulnak(ahogy az korábban már említésre került ebben a dokumentumban). A szervezeti kérdések is beleérthetők a hivatalos gyűjtemények fejlesztésébe (amely a nyilvános könyvtárakra összpontosulhat - 'közösségi gyűjtemény) valamint ezzel összefüggésben a digitális tartalmak megőrzésének együttműködésbe . (The Digital Preservation Coalition (http://www.jisc.ac.uk/dner/preservation/prescoalition.html) egy példa erre a megközelítésre). Még nincs egyezség a megfelelő tartós eszköz kérdésében a hosszú távú megőrzéshez, de középtávon érdemes lenne eldönteni ezt. LINKEK Nemzetközi UNESCO Memory of the World Programme. http://www.unesco.org/webworld/mdm/index_2.html UNESCO Memory of the World programme. Storage of and Access to Data: The Solution for the Compound Document http://www.unesco.org/webworld/mdm/czech_digitization/doc/intro.htm Bibliotheca Universalis http://www.kb.nl/gabriel/bibliotheca-universalis/digit.htm IFLA Has been active through both its Preservation and Conservation (PAC) and Universal Availability of Publications (UAP) Programmes Dánia Danske Billeder Franciaország Lyon http://www.addnb.org/fr/docs/numlyon.htm http://www.addnb.org/fr/docs/numproj.htm http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_04.htm http://www.culture.fr/culture/mrt/numerisation/fr/dll/index.htm Magyarország Linkgyűjtemény a digitalizálásról Az Országos Széchenyi Könyvtár digitalizálási stratégiája Digitális oktatási segédanyagok fejlesztése: Az Informatikai
és Hírközlési Minisztérium az Oktatási Minisztérium pályázata Az Informatikai és Hírközlési Minisztérium az Oktatási
Minisztérium pályázata Németország Ulm http://www.stadtbibliothek.ulm.de/ Egyesült Királyság http://www.ukoln.ac.uk/public/earl/issuepapers/digitisation.htm Gould, Sara and Ebdon, Richard 'IFLA/UNESCO Survey on Digitisation
and Preservation' 'Digital imaging: a practical handbook' London: Library Association Publishing, 2000. ISBN 1-85604-353-3 Leeds The nof-digitise Programme and its Technical Standards and Guidelines http://www.ukoln.ac.uk/nof/support/manual/ Powys Digital History Project |
||