3. RÉSZ - TECHNIKAI KÖVETELMÉNYEK Soknyelvűség technikai kérdései
Összefoglaló Feladatkör Ez az útmutató lefedi a soknyelvű szolgáltatások és információ visszakeresés technikai szempontjait. Valamint bizonyos fokig szociális értelemben a stratégiai kérdéseket, egy többnyelvű közösség szolgáltatásokkal való ellátását. Stratégiai kérdések A többnyelvű közösségek állhatnak
A könyvtárak stratégiájukban összetett elveket kell érvényesíteniük, harmonizálva a különböző variációkkal. Gyakorlati javaslatok
Távlati tervek A jövőben javulást kellene elérni az etnikai kisebbségnek nyújtott szolgáltatásban, olyan példákat követve, mint amit az északi országok alkalmaznak. Hangról, hangra való fordítás. Témakör Témák, amellyel ez az útmutató foglalkozik: Szolgáltatások a bevándorlóknak Betűkészletek és billentyűzetek Betű szerinti átírás és fonetikus átírás Stratégiai kérdések Nyelvtudományi kérdések egy többnyelvű nemzetközi közösségben, mint ez EU, központi problémák. 2001 volt a Nyelvek Európai Éve, célja a bátorítás volt, hogy tanuljanak és tanítsanak nyelveket. Az EU-n belül szintén foglalkoznak a bennszülött kisebbség helyzetével vagy az őshonos nyelvekkel, létezik egy Európai Tudakozó a Kisebbségi Nyelvet Használóknak (EBLU) lásd: http://www.eblul.org/. Kb. 40 millió EU polgárra becsülik azok számát, akik eltérő nyelvet beszélnek attól a hivatalos nyelvtől, amely államban élnek és a modern társadalmi körülmények nem kedveznek ezen kisebbségi nyelvek használatának, és életben maradásának. Az EBLU ezen felül hozzájárul az Európai Alapvető Jogi Kartájához egy záradékkal, hogy "kívánatos egy közösség saját nyelvét és kultúráját bővíteni más közösségbeli tagokéval, mintegy ezzel kifejezni, hogy a kulturális és nyelvi különbözőség egy közös európai örökség". Szintén létezik egy Európai Karta a Helyi vagy Kisebbségi Nyelvekért, amelyben az aláírók elrendelik, hogy "határozott fellépéssel szükséges elősegíteni a helyi és kisebbségi nyelvek megvédését". Lásd még Mercator a www.mercator-central.org -on.
Egyike a három cselekvési szálon futó EK-i e-Tartalom programnak a tartalom előállítás növelése többnyelvű és multi-kulturális környezetben. Ez mintegy a tartalom és nyelvi ipar metszeteként jelenik meg. Az Internet, média, és nyelvi technológiák felemelkedése lassabb, mint a verseny régiókban, és ez észrevehetően fontos az európai online termékek, és szolgáltatások tömegpiacának fejlesztéséhez. Technológiai szempontokból jól értelmezett, de nem a gyakorlati felhasználás felé irányulnak. Szolgáltatások a bevándorlóknak A szolgáltatások biztosítása a frissen bevándorlóknak, problémákat jelent egy nyilvános könyvtárnak, ami a szolgáltatásban, és bizonyos tényezőiben előre jelezhető:
A bevándorlók gyakran belefeledkeznek az alap gazdasági, legális és más szükséghelyzetekbe, miközben az a fontos, hogy felismerjék, a könyvtár segíteni tudja őket, többek között ilyen jellegű anyagokkal. A könyvtárosoknak ismerniük kell az ilyen közösségeket, azok etnikai összetételét és néhány nagyvárosban a népesség mozgását, ami magában foglalhat bizonyos időnkénti rendszeres ellenőrzést. Szükség lehet megtárgyalni, kérdőíveket felhasználva felmérni azt, hogy részletesen kiderüljön, mire van szüksége egy közösségnek. Kapcsolatban lehet lenni a bevándorlási szervekkel. A könyvtár helyszíne lehet nyelvi kurzusoknak, és kulturális eseményeknek. Egy bevándorló közösség hű támogatója és szövetségese lehet a könyvtári szolgálatnak, ha bőkezűen és tapintatosan közelítenek hozzájuk. A bevándorlók nyelvi anyagokkal való ellátása jól mutatja azokat a területeket, amelyeket a szakembereknek meg kell oldaniuk; katalogizálni, feldolgozni, és ajánlani a könyvtári anyagokat az olvasóknak. A tipikusan ajánlott anyagok:
Lásd még társadalmi beilleszkedés és élethosszig tartó tanulás. GYAKORLATI JAVASLATOK A könyvtáraknak óvatosnak kell lenniük a nyelvi problémákkal kapcsolatosan azon közösségekben, ahol a szolgáltatásokat nyújtják. Részben azokat a bevándorlókat, akiknek hiányos a többségi nyelvi ismerete, el kell látni többféle szinonimával, amelyek megegyezhetnek a szöveg eredeti jelentésével. Néhány nagyvárosban, ahol gyors a népesség változás a könyvtáraknak nyelvi felméréseket kell végezniük a használóik körében. A szolgáltatások:
Lásd még társadalmi beilleszkedés Szolgáltatások a bennszülött nyelvi kisebbségeknek Az őshonos nyelvi kisebbségek ellátása nem jelent a könyvtáraknak ugyanolyan feladatokat, mint a bevándorlók esetében. Például:
Lásd még a forrásleírást. Egy tezaurusz az alkalmazott kifejezések összeállítása egy nyomtatott kiadvány részletes tárgyi indexeként. Egy tezaurusz hierarchikusan és mellérendelő viszonyban megmutatja az egyes használt kifejezések közötti rokonságot. A fő probléma a tezaurusz konstrukcióban, a többnyelvűség megjelenése, mert nem fedi le a különböző nyelveken az egyes kifejezések jelentésbeli különbségeit. Példák:
A tezauruszkészítés szabványát és az egyes kifejezéseknek különböző nyelvekben a párhuzamát lásd a Getty Információs Intézet összeállításában: A formális nyelvi egyezőség útmutatója: egy a művészeti és építészeti tezauruszon alapuló modell című kiadványt a www.chin.gc.ca/Resources/Publication/_Guidelines/English/index.html oldalon. Lásd még ISO 5964:1985 (BS 6723:1985) Útmutató a többnyelvű tezaurusz kialakításához és fejlesztéséhez. Ez a szabvány egy segédlet az ISO 2788-hoz, amely az egynyelvű tezauruszkészítést tartalmazza és önmagában nem teljes, sok tezaurusz konstrukcióval kapcsolatos probléma a két kiadványban együtt található meg. Egy kétnyelvű weboldal szerkezetét a kezdetektől megfontoltan kell kialakítani, hogy a kétnyelvűség alapvető része legyen, és ne csak egy utógondolat. Különféle stratégiai elképzelések létezhetnek, amelyek messzemenőkig hatással vannak a weboldal megjelenésére:
Ne feledjük, hogy egy kétnyelvű weboldal nem olcsó választás és hogy, a többi weboldalhoz hasonlóan frissítést igényel, nem olyan egyszerű, mint egy egynyelvű weboldal. A kétnyelvű weboldal felhasználása:
Jó néhány alapvető módja van egy kétnyelvű weboldal kialakításának:
Hogy melyik típusú kétnyelvű formátumot alkalmazzuk, az attól függ, hogy milyen közönségnek szánjuk - kétnyelvű személyeknek, vagy azoknak, akik az egyik, vagy másik nyelvet beszélik, de nem mind a kettőt:
Javaslatok a kétnyelvű weboldalak kinézetére: lásd a Walesi nyelvi tábla-t egy üzleti oldal példáját. Ez a weboldal külalak tekintetében a legtalálóbb megoldás és ajánlható, mint legjobb példája a kétnyelvűség kialakítására, minden túlzott feltűnés nélkül egyik nyelvről a másikra lehet váltani elkerülve a nem megfelelő eszközöket, érzelmi vagy politikai szimbólumokat, mint zászlókkal megjeleníteni a nyelveket, pl. az angol zászló kapcsán csillagokkal és sávokkal szimbolizálni egy weboldal angol nyelvi verzióját, megannyi országban beszélnek több nyelven és sok ország kétnyelvű. Lásd még további ajánlásokat kétnyelvű weboldalak konstrukciójára. Szerepet játszhat az érintőképernyős technológia a weboldalak kialakításában és az online katalógusoknál, különösen, ahol szükségszerű a többnyelvű közösségeknek szolgáltatni. Betűk, billentyűzetek és nem-európai szövegek ISO 8859 vagy Unicode (ISO 10646) egy egyedi kettes számrendszerbeli szám jelöl minden karaktert minden nyelvben, nem számít, hogy milyen platformon, programban, vagy nyelvben. Az Unicode konzorcium egy non-profit szervezet, melyet a fejlesztésért, bővítésért, a szabványok használatának segítéséért hoztak létre. Megbirkózik az arab és a héber nyelv kétirányúságával, és folyamatosan növekszik, napjainkra magában foglalja az archaikus betűkészletet, mint az ogham. Lásd www.unicode.org. A rendszer kedvezett az IT iparnak, mint egy olyan eljárás, amely nyilvánvalóan előnyökkel jár, de ez nem jelenti azt, hogy ez az egyedüli szabvány lenne ezen a területen. Egyéb Unicode elven alapuló üzleti termékek is léteznek, amelyek listája megtalálható a www.fingertipsoft.com oldalon. A kiskapitálist meg lehet vásárolni, amely lefedi a normál billentyűzet billentyűit, a cél, hogy a nyelvi gépelésben használják a bővített latin betűkészletet, pl. ð å þ ñ ç æ æ ł stb. Ez az egyszerű eljárás képes megjeleníteni a Japán Kanji szöveget és szerkeszthetővé tenni. A finom billentyűzetek, vagy billentyűzet megjelenítők egy érintő képernyőn, rugalmasan kezelik a nem-római vagy exotikus betűk közötti problémákat. A nyelvek a karakterek ezreivel, mint a kínai, egy speciális szoftvert igényelnek, mielőtt szövegszerkesztőben lehetne használni ezeket a karaktereket. A kínaiak egy normál billentyűzetet úgy használnak, hogy a kínai szót fonetikusan betűzik, pl. a feng shui a transzliterációs Pinyin rendszernek megfelelően és a szoftver, ami megjeleníti a kimondott karaktereket - melynek száma akár tíz vagy annál is több lehet. A helyes karakter, vagy karakterek kiválasztása és beillesztése egy dokumentumba. A rossz választás a kínaiban lehet a helytelen betűzés miatt. A rendszer adaptálható, képes a hagyományos és az egyszerűsített kínai karaktereket szerkeszthetővé tenni. A Pinyin rendszer használata esetén a kezelőnek ismernie kell a kínai nyelv mandarin és a pekingi kiejtéseit, amelyet a kézírás esetén nem szükséges ismerni. Bár olyan szoftvert is lehet vásárolni, amely a kantoni kiejtésen alapul. Lásd a http://www.asiasoft.com/ oldalt. A szoftver több helyet foglal a számítógép memóriájában, mint a hagyományos latin karakteres nyelvi szövegszerkesztő, bár azokban a városokban, ahol meglehetősen nagyszámú kínai él, ott jogos egy ilyen szoftvert megvásárolni, és bizonyos kijelölt számítógépeken hozzáférhetővé tenni a nyilvános könyvtárban. Az arab karakterek kevesebb problémát jelentenek, található hozzá speciális billentyűzet is. Betű szerinti átírás, fonetikus átírás és forrásfájl. Sok esetben, pl. katalóguskészítésnél, indexelésnél, helységnévtáraknál és más bibliográfiai jellegű munkánál, amelyet a latin ábécében jártas emberek használnak, vagy tipográfiai okokból, de nem praktikus nem latin karakterkészletet használni. Abban az esetben a transzkripció, vagy transzliteráció szükséges lesz. A transzliteráció olyan eljárás, amely során egy bizonyos írás szerint leírt betűket konvertálják más karakterkészlet szimbólumaira, pl. cirillt vagy görögöt latin írásra. A probléma csak a különböző alternatív megoldásoknál adódik csak, pl. Чехов -ot lehet Tchehov-nak йs Chekhov-nak is transzliterálni. A transzkripció elvileg egy nyelv hangzására használják, de ezt a rendszert a nem ábécérendszerű szövegeknél is használják, pl. kínai, vagy más írásrendszert lehet így latin karakterekkel megjeleníteni. Kétségkívül problémás a transzliteráció, transzkripció eredményét szabványosítani. A különböző rendszerek, vagy a gyakorlatban használt variációk nehézségeket okoz az adatbázisokban való keresésnél. Jelenleg nincs szabványos rekordformátum az európai kulturális intézményekben, de a LEAF projekt (Linkelhető és Böngészhető Forrás Fájlok) keretében, kidolgozás alatt van, melyet az EK támogat 2001 márciusától. Nemzetközi szabványok lesznek kidolgozva a különböző nyelvi variációk érdekében, lásd ISO TC46/SC2 és Diffuse. Van egy szabványa az indiai karakterek transzliterációjának ISO 15919:2001, A Devanagari és indiaival rokon karakterek transzliterációja latin karakterekké. Olyan szoftvert is lehet találni, amely a görögöt és cirillt transzliterálja latinná. Lásd még a zenei anyagokat. Egy időben nagy reményeket fűztek hozzá, de tekintettel a ráfordított erőfeszítésekre az 1950-es évektől, az eredmény kiábrándítónak tűnik. A problémák, amelyeken megbukott, és amelyek igazolták, hogy lehetetlen kivitelezni az például:
Az MT-re fordított kutatásokat napjainkra csökkentették. Az MT rendszer hatékonysága néhány tényezőtől függ, pl. a dokumentumnak tipográfiai és nyelvtani hibáktól mentesnek kell lennie, ha bizonyos szavak nincsenek a rendszer szótárában, vagy függhet az összetett mondatoktól. Ténylegesen arra lehet használni, hogy egy dokumentum lényegét, általános jelentését megadjuk vagy nagyszámú dokumentum áttekintésére, amelyet emberi fordítókkal nem lehet megoldani. Az internetes keresőmotorok felajánlják néhány weboldal gépi fordítását: lásd http://www.google.com/ és babelfish, amely a japán, koreai és kínai nyelvek fordítását ajánlja. Van néhány weboldal az interneten, amely MT-t ajánl, pl. Alittera. A Babblefish bejárat néhány webalapú fordítási szolgáltatáshoz http://www.babblefish.com/. Néhány weboldal kínál fizetős és ingyenes fordítási szolgáltatást a World Wide Web-en. Ha egy URL-t begépelünk egy MT szoftverbe, akkor le tudja fordítani az oldalakat és dokumentumokat automatikusan - ezek az oldalak gyakran emberi fordításúak, pl. World Lingo; AlphaWorks; FreeTranslation és Systran. Lásd még szolgáltatások kialakítása.
TÁVLATI TERVEK
Hangról, hangra történő fordítás. Jelenleg a hangról hangra fordítás, hogy egy gép egyik nyelvről a másikra fordít csak egy tudományos elképzelés. Ilyen eszköznek magában kell foglalnia néhány összetett technológiai eljárást, amelyek jelenleg hiányosak:
Létezik kereskedelmi beszédfelismerő szoftver, amely a beszédet szöveggé konvertálja, de az eredmények nem kielégítőek. 9%-ban pontos jelentés, 5% nem pontos, vagy minden 100 szóban 5 hiba (pl. 20 ebben a cikkben). A szövegről szövegre gépi fordítás hiányosságait már megvitattuk: ha bármilyen gépi fordítást alkalmazunk, a bevitelnek tökéletesnek kell lennie, minden hangfelismerő szoftver hibázik. A szöveget némi sikerrel át lehet konvertálni beszédre; ez az egyedüli része a szükséges technológiának, amely megfelelő állapotban van. LINKEK Denmark Danish Central Library for Immigrant Literature (Indvandrerbiblioteket) 146,000 egységkb.100 nyelv . http://www.indvandrerbiblioteket.dk/ Finland Multicultural Library (MCL) Helsinki és Oslo tartja fenn, multiculturális szolgáltatás Interneten keresztül Helsinki City Library Multilingual Library Service www.lib.hel.fi/ulkkirja/ english.html Norway Deichman Library, Oslo 37 nyelven http://nyhuus.deich.folkebibl.no/ Sweden The Kurdish Library, Stockholm http://www.kurdishlibrary.org/ Stockholm's International Library or Internationella Biblioteket 200,000 könyv 125 nyelv www.ssb.stockholm.se/ inva/ilc.htm Sweden/Norway Nordic Book mobile co-operation in Lapland http://www.muonio.fi/kirjasto/kirjastoauto.html United Kingdom CILLA Szolgáltatás hindu nyelveken, pl. Urdu, Gujarati, Hindi, Punjabi, Tamil, Bengali nyelven http://www.swrls.org.uk/National.htm. Conway County Borough Council Kétnyelvű, angol és welsh web oldal Edinburgh City Libraries' Ethnic Library Service Arabic, Bengali, Chinese, Gujarati, Hindi, Punjabi and Urdu http://www.edinburgh.gov.uk/Libraries (pick "Collections and Publications" from the menu). Plymouth Library Services http://www.webopac.plymouth.gov.uk/cgi-bin/community_2000.sh?enqtype=TRANS&e |
||