La projekto Distribuita Lingvo-Tradukado (DLT) estis esplora kaj
evoluiga projekto de la programarentrepreno BSO/Buro voor
Systeemontwikkeling en Utrecht (Nederlando), kies celo estis evoluigi
prototipon de sistemo de perkomputila tradukado, kiu devis esti
- multlingva,
- malcentra en komputila reto,
- uzebla por unulingva, laika uzanto.
El tiuj premisoj sekvas aro da konsekvencoj, kiuj determinis la
arkitekturon de la sistemo:
1. Multlingveco
La kondiĉo de multlingveco necesigas, ke eblu facile aldoni pliajn
lingvojn.
En komputila traduksistemo, kiu baziĝas sur rekta ligo inter la fonta
kaj la cela lingvoj, necesas por "n" lingvoj "n(n-1)" traduksistemoj, do
sistemo liganta ĉiun el la koncernaj lingvoj al ĉiu alia el la lingvoj en
la tiena kaj la reena direktoj.
Ekzemple, deklingva sistemo enhavas 90 traduksistemojn, kaj por aldoni
la dekunuan lingvon necesas konstrui 20 pliajn sistemojn.
Por eviti tion, oni enkondukas interlingvon, tiel ke ĉiu traduko iru el
ajna fonta lingvo al la interlingvo kaj de tie plu al la dezirata(j)
cela(j) lingvo(j). Interlingva sistemo bezonas por dek lingvoj 20
sistemojn, kaj la aldono de plia lingvo kostas ĉiam nur du pliajn
sistemojn.
2. Malcentreco
La kondiĉo de malcentreco en reto signifas, ke oni en la sendanta
komputilo traduku la tekston unufoje kaj en ĉiu el la ricevantaj
komputiloj duan fojon, tiam en la celan lingvon tie elektitan. Do povas
okazi paralelaj tradukoj en diversajn celajn lingvojn; tiuj tradukoj ne
bezonu okazi samtempe kaj oni ne devu dekomence scii, en kiu(j)n
lingvo(j)n oni fine mendos tradukojn.
El ĉi tiu kondiĉo, lige kun konsideroj de ekonomio kaj administrebleco,
sekvas, ke oni elektu kiel sendan formon de la mesaĝoj la interlingvon.
Tiel ĉiu mesaĝo vojaĝas en nur unusola formo.
La konsekvencoj diskutitaj en (1) kaj (2) nur eblas, se la interlingvo
estas aŭtonoma, t.e. se la formo de la esprimo, la gramatika aranĝo de la
teksto kaj la vortelekto estas sendependaj de la demando, ĉu la teksto
venas el tiu aŭ alia fonta lingvo kaj ĉu ĝi pluiru en tiun aŭ alian celan
lingvon.
3. Uzebleco
La kondiĉo de uzebleco por laika uzanto ne reganta la celan lingvon
havas la jenajn konsekvencojn:
De la kvindekaj jaroj estas ĝenerale agnoskita kaj ĝis hodiaŭ ne
kontestita la diagnozo, ke tut-aŭtomata, altkvalita tradukado estas
malebla. (Eblas nur tutaŭtomata krudakvalita tradukado aŭ altkvalita
tradukado realigita kunlabore inter homo kaj komputilo.En ĉi-lasta kazo la
kontribuo de la homo povas okazi antaŭ, dum aŭ post la laboro de la
sistemo. Se antaŭe, do povas temi pri verkado en aŭ adaptado al aparte
faciligita lingvaĵo, temo ofte diskutata en la faktereno.)
Por DLT la konsekvenco estas, ke en la tradukprocezo necesas helpo fare
de la uzanto. ĉar la uzanto regas nur la fontan lingvon, la helpo okazu
pere de interaga dialogo en la fonta lingvo. Ĉar la sistemo funkciu
malcentre, praktike maleblas, ke la uzanto helpu en tiu parto de la
tradukado, kiu kondukas de la interlingvo al la cela lingvo, ĉar tiu parto
ja okazas dise en la mondo kaj en neantaŭvideblaj momentoj horojn, tagojn
aŭ jarojn post la origina survojigo de la mesaĝo.
El ĉi ĉio sekvas, ke la kontribuo de la uzanto okazu en la unua parto
de la tradukprocezo, do dum la tradukado el la fonta lingvo en la
interlingvon.
La posta plutradukado el la interlingvo en la celan lingvon okazu
tutaŭtomate kaj estu altkvalita. Ĉar tamen tutaŭtomata altkvalita
tradukado ne eblas, necesas do, ke la interlingvo estu en decida maniero
pli plutraduktaŭga ol ordinara lingvo.
La rolo de Esperanto
Jen la rolo de Esperanto: Por DLT estis elektita Esperanto kiel
interlingvo. Esperanto kombinas en si du ecojn: ĝi estas pli klara ol
etnaj lingvoj (sintakse, vortfarade) kaj ĝi estas samtempe aŭtonoma.
- La sintaksan kaj vortstrukturan klarecon necesas plifortigi kompare
al la normala homa Esperanto. (Vidu sube.)
- La aŭtonomecon Esperanto ne posedis jam en 1887. Ĝi ĝin akiris per
multjardeka nekonscia uzado en (dualingva) lingvokomunumo. Per tio
Esperanto posedas decidan avantaĝon kompare al eblaj interstrukturoj
artefaritaj por ĉi tiu apliko.
Modifita Esperanto
Kelkaj vortoj pri la modifoj faritaj en Esperanto por DLT. La temo de
tempo al tempo ekscitas diskutantojn, kiuj uzas ĝin aŭ por ataki la
projekton DLT aŭ por ĉerpi subtenon al la propraj projektoj por reformita
Esperanto.
En la preparstudo por DLT (vidu sube) estis proponita aro da modifoj
kiuj igu Esperanton pli taŭga por sia funkcio en DLT. Dum la prototipa
projekto (vidu sube) okazis praktika eksperimentado pri parsado, aranĝo de
sintaksaj kaj vortfaradaj strukturoj de Esperanto kaj pri la fazo de
struktura transiro, kiu estas centra funkcio en tradukado. Okazis ankaŭ
praktikaj eksperimentoj kaj testoj pri la vorttransiro, kiu estas la ĉefa
semantika obstaklo malebliganta la tutaŭtomatan altkvalitan tradukadon.
Post ĉi ĉiuj eksperimentoj la DLT-teamo konstatis, ke la plejparto el
la origine proponitaj modifoj en Esperanto ne necesas por la interlingvo
de DLT. Ĉar poste la semantika traktado necesigis ĉerpon de scio el
grandkvantaj tekstaroj, kiuj ekzistas en Esperanto, sed ne en iu modifita
formo de Esperanto, la kiel eble plej proksima reiro al Esperanto fariĝis
des pli dezirinda. Restis ne pli ol du esencaj modifoj:
- La interlingvo de DLT uzis signojn de morfemlimoj, tiel malebligante
misanalizojn de vortoj kiel la famkonataj kol/eg/o-koleg/o, sen/dat/a-
send/at/a ktp. (Oni sen/dub/e memor/as, ke tiu/j/n morfem/sign/o/j/n jam
en/konduk/is Zamenhof.)
|
|
Ĉi tiun regulon akompanas iom da fajnpolurado de la
Esperanta morfemsistemo, ekz. necesis difini la tabelvortojn "kiu", "tiu"
ktp. kiel unu-morfemajn, ĉar ilia fina "-u" ja ne estas la imperativa
"-u". Oni povas uzi ĉi tiun liberecon de difinado ankaŭ por ripari kelkajn
perturbojn de la vortfarado, ekz. difinante la kunmetaĵon terpom' kiel
unumorfeman, ĉar evidente ne temas pri ia tera speco de pomo, sed pri
pruntita metaforo maltipa por la Esperanta vortfarado.
- La interlingvo de DLT estis sintakse unusenca. Oni per tio evitas
amason da misanalizoj de frazstrukturoj, kiujn homo kutime apenaŭ
rimarkas, sed kiuj ja grave malhelpas la aŭtomatan analizon de frazoj.
Jam la preparstudo de DLT montris, ke por tiu sintaksa unusencigo
sufiĉas unusola signo, kiun oni uzis kiel signon de sintagmofino.
Ekzemplo: Malfiksu la ŝraŭbon de la kovrilo kiu estas fiksita per aparta
plasta ringo.
Eblaj analizoj:
- ŝraŭbo kiu estas fiksita
- kovrilo kiu estas fiksita
Unusencigo en DLT: Se "kiu" rilatas al "kovrilo", do "la kovrilo kiu
estas fiksita per aparta plasta ringo" estas sintagmo, kiu dependas de la
prepozicio "de". Se "kiu" rilatas al "ŝraŭbo", do de "de" dependas nur "la
kovrilo", oni do metas sintagmofinan signon, kiu informas analizajn
funkciojn, ke "kiu..." ne dependas de "kovrilo", sed de io alia. La
reganto de "kiu..." do estas "ŝraŭbo".
Kalendaro de DLT:
1979. Toon Witkam, kunlaboranto de BSO, havas la originan ideon traduki
perkomputile en retoj kaj kun Esperanto kiel interlingvo.
1982-1983. Prepara fazo. Preparstudo realigita de Toon Witkam kun unu
kunlaboranto kun subvencio de la Eŭropa Komunumo.
1984-1990. Prototipa fazo BSO ricevas kvindekprocentan subvencion de la
nederlanda registaro por prototipa evoluigo dum ses jaroj. La firmao
starigas la sekcion BSO/Research kaj dungas grandan teamon (maks. ĉ. 20
personojn) kaj evoluigas serion da prototipoj por la lingvoparo angla-
franca tra la interlingvo Esperanto.
1987. Prezento de la unua prototipo al la faka gazetaro en Utrecht.
1988. Prezento de la dua prototipo al la faka publiko en la konferenco
Coling en Budapeŝto.
1988-90. Pluevoluigo de novaj teknikoj surbaze de la testrezultoj de la
unuaj prototipoj, petoj (kaj parte asignoj) de patentoj.
1990. Laŭplana fino de la projekto.
(1990-1992) La firmao kuntenis la teamon fondante novan sekcion
BSO/Language Technology en Baarn (Nederlando), kiu vendis programarajn
servojn en lingvoteknologia tereno surbaze de la spertoj el DLT.
Bazaj karakterizaĵoj de DLT (aldone al la supre klarigitaj kondiĉoj de
multlingveco, malcentra uzado kaj aplikebleco por laikoj kun ĉiuj ties
sekvoj) estas:
- Duobla transira traduko kun Esperanto kiel interlingvo.
- Dependosintakso.
- Implica solvo de la semantika kaj mondoscia problemaro de
vort-transiro.
La unua solvo provis uzi sciobankon de vortrilatoj en la interlingvo.
La posta solvo uzis lingvoparajn sciobankojn el paralelaj tekstoj en la
interlingvo kaj po unu el la fontaj kaj celaj lingvoj (t.n. Dulingva
Sciobanko). Ĉi tiu solvo estas ankoraŭ nun avangarda kompare kun la
traduksistemoj disponeblaj en la merkato.
La projekto ampleksis ĉ. 50 homjarojn da laboro.
Mi, kiu verkas ĉi tiun resumon kunlaboris en BSO de 1985 ĝis 1992, en
la finaj monatoj de DLT kiel projektestro.
Klaus
Schubert klaus.schubert@flensburg.netsurf.de schubert@fhf-tue.com
Esenca bibliografio:
Witkam, A. P. M. (1983): Distributed Language Translation. Feasibility
Study of a Multilingual Facility for Videotex Information Networks.
Utrecht: BSO [la preparstudo]
Papegaaij, Bart C. (1986): Word Expert Semantics. Red. V. Sadler kaj A.
P. M. Witkam. Dordrecht/Riverton: Foris [la semantika sistemo de DLT, unua
versio kun nuresperanta sciobanko]
Schubert, Klaus (1986): Linguistic and Extra-Linguistic Knowledge. En:
Computers and Translation 1: 125-152 [la tradukprocezo de DLT en plena
trairo]
Schubert, Klaus (1987): Metataxis: Contrastive Dependency Syntax for
Machine Translation. Dordrecht/Providence: Foris [la dependosintaksa
gramatikmodelo de DLT, unulingva kaj strukturtransira]
Papegaaij, Bart kaj Klaus Schubert (1988): Text Coherence in
Translation. Dordrecht/Providence: Foris [transfrazaj fenomenoj]
Maxwell, Dan, Klaus Schubert kaj Toon Witkam (red.) (1988): New
Directions in Machine Translation. Dordrecht/Providence: Foris
[konferencvolumo de antaŭ-Coling-konferenco en Budapeŝto en 1988]
Schubert, Klaus (1989): An Unplanned Development in Planned Languages.
En: Klaus Schubert (kun Dan Maxwell( (red.): Interlinguistics. Berlin/New
York: Mouton de Gruyter, 249-274 [esperanta vortgramatiko]
Sadler, Victor (1989): Working with Analogical Semantics.
Dordrecht/Providence: Foris [la plej kompleta prezento de la semantika
modelo de DLT, dua version kun Dulingva Sciobanko]
Maxwell, Dan kaj Klaus Schubert (red.) (1989): Metataxis in Practice.
Dordrecht/ Providence: Foris [aplikoj de la dependosintaksa modelo al aro
da lingvoj; enhavas i.a. dependosintakson de Esperanto]
Sadler, Victor (1990): Machine Translation Project Reaches Watershed.
En: Language Problems and Language Planning 15 [enhavas pliajn detalajn
bibliografiajn (!) indikojn]Schubert, Klaus (1992): Esperanto as an
Intermediate Language for Machine Translation. En: John Newton (red.):
Computers in Translation. London/New York: Routledge, 78-95
|