Kopio el la retejo de Pejno Simono:

de Klaus SCHUBERT:


DLT - faktoj pri finita projekto



Tra Esperantujo fantomas raportoj, supozoj kaj onidiroj pri la projekto DLT. Por reale vidi, jen resumo de Klaus Schubert (kunlaboranto kaj projektestro inter 1985-92), afiŝita en la forumo "soc.culture.esperanto".

La projekto Distribuita Lingvo-Tradukado (DLT) estis esplora kaj evoluiga projekto de la programarentrepreno BSO/Buro voor Systeemontwikkeling en Utrecht (Nederlando), kies celo estis evoluigi prototipon de sistemo de perkomputila tradukado, kiu devis esti

  • multlingva,
  • malcentra en komputila reto,
  • uzebla por unulingva, laika uzanto.

El tiuj premisoj sekvas aro da konsekvencoj, kiuj determinis la arkitekturon de la sistemo:

1. Multlingveco

La kondiĉo de multlingveco necesigas, ke eblu facile aldoni pliajn lingvojn.

En komputila traduksistemo, kiu baziĝas sur rekta ligo inter la fonta kaj la cela lingvoj, necesas por "n" lingvoj "n(n-1)" traduksistemoj, do sistemo liganta ĉiun el la koncernaj lingvoj al ĉiu alia el la lingvoj en la tiena kaj la reena direktoj.

Ekzemple, deklingva sistemo enhavas 90 traduksistemojn, kaj por aldoni la dekunuan lingvon necesas konstrui 20 pliajn sistemojn.

Por eviti tion, oni enkondukas interlingvon, tiel ke ĉiu traduko iru el ajna fonta lingvo al la interlingvo kaj de tie plu al la dezirata(j) cela(j) lingvo(j). Interlingva sistemo bezonas por dek lingvoj 20 sistemojn, kaj la aldono de plia lingvo kostas ĉiam nur du pliajn sistemojn.

2. Malcentreco

La kondiĉo de malcentreco en reto signifas, ke oni en la sendanta komputilo traduku la tekston unufoje kaj en ĉiu el la ricevantaj komputiloj duan fojon, tiam en la celan lingvon tie elektitan. Do povas okazi paralelaj tradukoj en diversajn celajn lingvojn; tiuj tradukoj ne bezonu okazi samtempe kaj oni ne devu dekomence scii, en kiu(j)n lingvo(j)n oni fine mendos tradukojn.

El ĉi tiu kondiĉo, lige kun konsideroj de ekonomio kaj administrebleco, sekvas, ke oni elektu kiel sendan formon de la mesaĝoj la interlingvon. Tiel ĉiu mesaĝo vojaĝas en nur unusola formo.

La konsekvencoj diskutitaj en (1) kaj (2) nur eblas, se la interlingvo estas aŭtonoma, t.e. se la formo de la esprimo, la gramatika aranĝo de la teksto kaj la vortelekto estas sendependaj de la demando, ĉu la teksto venas el tiu aŭ alia fonta lingvo kaj ĉu ĝi pluiru en tiun aŭ alian celan lingvon.

3. Uzebleco

La kondiĉo de uzebleco por laika uzanto ne reganta la celan lingvon havas la jenajn konsekvencojn:

De la kvindekaj jaroj estas ĝenerale agnoskita kaj ĝis hodiaŭ ne kontestita la diagnozo, ke tut-aŭtomata, altkvalita tradukado estas malebla. (Eblas nur tutaŭtomata krudakvalita tradukado aŭ altkvalita tradukado realigita kunlabore inter homo kaj komputilo.En ĉi-lasta kazo la kontribuo de la homo povas okazi antaŭ, dum aŭ post la laboro de la sistemo. Se antaŭe, do povas temi pri verkado en aŭ adaptado al aparte faciligita lingvaĵo, temo ofte diskutata en la faktereno.)

Por DLT la konsekvenco estas, ke en la tradukprocezo necesas helpo fare de la uzanto. ĉar la uzanto regas nur la fontan lingvon, la helpo okazu pere de interaga dialogo en la fonta lingvo. Ĉar la sistemo funkciu malcentre, praktike maleblas, ke la uzanto helpu en tiu parto de la tradukado, kiu kondukas de la interlingvo al la cela lingvo, ĉar tiu parto ja okazas dise en la mondo kaj en neantaŭvideblaj momentoj horojn, tagojn aŭ jarojn post la origina survojigo de la mesaĝo.

El ĉi ĉio sekvas, ke la kontribuo de la uzanto okazu en la unua parto de la tradukprocezo, do dum la tradukado el la fonta lingvo en la interlingvon.

La posta plutradukado el la interlingvo en la celan lingvon okazu tutaŭtomate kaj estu altkvalita. Ĉar tamen tutaŭtomata altkvalita tradukado ne eblas, necesas do, ke la interlingvo estu en decida maniero pli plutraduktaŭga ol ordinara lingvo.

La rolo de Esperanto

Jen la rolo de Esperanto: Por DLT estis elektita Esperanto kiel interlingvo. Esperanto kombinas en si du ecojn: ĝi estas pli klara ol etnaj lingvoj (sintakse, vortfarade) kaj ĝi estas samtempe aŭtonoma.

  • La sintaksan kaj vortstrukturan klarecon necesas plifortigi kompare al la normala homa Esperanto. (Vidu sube.)
  • La aŭtonomecon Esperanto ne posedis jam en 1887. Ĝi ĝin akiris per multjardeka nekonscia uzado en (dualingva) lingvokomunumo. Per tio Esperanto posedas decidan avantaĝon kompare al eblaj interstrukturoj artefaritaj por ĉi tiu apliko.

Modifita Esperanto

Kelkaj vortoj pri la modifoj faritaj en Esperanto por DLT. La temo de tempo al tempo ekscitas diskutantojn, kiuj uzas ĝin aŭ por ataki la projekton DLT aŭ por ĉerpi subtenon al la propraj projektoj por reformita Esperanto.

En la preparstudo por DLT (vidu sube) estis proponita aro da modifoj kiuj igu Esperanton pli taŭga por sia funkcio en DLT. Dum la prototipa projekto (vidu sube) okazis praktika eksperimentado pri parsado, aranĝo de sintaksaj kaj vortfaradaj strukturoj de Esperanto kaj pri la fazo de struktura transiro, kiu estas centra funkcio en tradukado. Okazis ankaŭ praktikaj eksperimentoj kaj testoj pri la vorttransiro, kiu estas la ĉefa semantika obstaklo malebliganta la tutaŭtomatan altkvalitan tradukadon.

Post ĉi ĉiuj eksperimentoj la DLT-teamo konstatis, ke la plejparto el la origine proponitaj modifoj en Esperanto ne necesas por la interlingvo de DLT. Ĉar poste la semantika traktado necesigis ĉerpon de scio el grandkvantaj tekstaroj, kiuj ekzistas en Esperanto, sed ne en iu modifita formo de Esperanto, la kiel eble plej proksima reiro al Esperanto fariĝis des pli dezirinda. Restis ne pli ol du esencaj modifoj:

  • La interlingvo de DLT uzis signojn de morfemlimoj, tiel malebligante misanalizojn de vortoj kiel la famkonataj kol/eg/o-koleg/o, sen/dat/a- send/at/a ktp. (Oni sen/dub/e memor/as, ke tiu/j/n morfem/sign/o/j/n jam en/konduk/is Zamenhof.)

[plu]

[retro] Ĉi tiun regulon akompanas iom da fajnpolurado de la Esperanta morfemsistemo, ekz. necesis difini la tabelvortojn "kiu", "tiu" ktp. kiel unu-morfemajn, ĉar ilia fina "-u" ja ne estas la imperativa "-u". Oni povas uzi ĉi tiun liberecon de difinado ankaŭ por ripari kelkajn perturbojn de la vortfarado, ekz. difinante la kunmetaĵon terpom' kiel unumorfeman, ĉar evidente ne temas pri ia tera speco de pomo, sed pri pruntita metaforo maltipa por la Esperanta vortfarado.

  • La interlingvo de DLT estis sintakse unusenca. Oni per tio evitas amason da misanalizoj de frazstrukturoj, kiujn homo kutime apenaŭ rimarkas, sed kiuj ja grave malhelpas la aŭtomatan analizon de frazoj.

Jam la preparstudo de DLT montris, ke por tiu sintaksa unusencigo sufiĉas unusola signo, kiun oni uzis kiel signon de sintagmofino. Ekzemplo: Malfiksu la ŝraŭbon de la kovrilo kiu estas fiksita per aparta plasta ringo.

Eblaj analizoj:

  • ŝraŭbo kiu estas fiksita
  • kovrilo kiu estas fiksita

Unusencigo en DLT: Se "kiu" rilatas al "kovrilo", do "la kovrilo kiu estas fiksita per aparta plasta ringo" estas sintagmo, kiu dependas de la prepozicio "de". Se "kiu" rilatas al "ŝraŭbo", do de "de" dependas nur "la kovrilo", oni do metas sintagmofinan signon, kiu informas analizajn funkciojn, ke "kiu..." ne dependas de "kovrilo", sed de io alia. La reganto de "kiu..." do estas "ŝraŭbo".

Kalendaro de DLT:

1979. Toon Witkam, kunlaboranto de BSO, havas la originan ideon traduki perkomputile en retoj kaj kun Esperanto kiel interlingvo.

1982-1983. Prepara fazo. Preparstudo realigita de Toon Witkam kun unu kunlaboranto kun subvencio de la Eŭropa Komunumo.

1984-1990. Prototipa fazo BSO ricevas kvindekprocentan subvencion de la nederlanda registaro por prototipa evoluigo dum ses jaroj. La firmao starigas la sekcion BSO/Research kaj dungas grandan teamon (maks. ĉ. 20 personojn) kaj evoluigas serion da prototipoj por la lingvoparo angla- franca tra la interlingvo Esperanto.

1987. Prezento de la unua prototipo al la faka gazetaro en Utrecht.

1988. Prezento de la dua prototipo al la faka publiko en la konferenco Coling en Budapeŝto.

1988-90. Pluevoluigo de novaj teknikoj surbaze de la testrezultoj de la unuaj prototipoj, petoj (kaj parte asignoj) de patentoj.

1990. Laŭplana fino de la projekto.

(1990-1992) La firmao kuntenis la teamon fondante novan sekcion BSO/Language Technology en Baarn (Nederlando), kiu vendis programarajn servojn en lingvoteknologia tereno surbaze de la spertoj el DLT.

Bazaj karakterizaĵoj de DLT (aldone al la supre klarigitaj kondiĉoj de multlingveco, malcentra uzado kaj aplikebleco por laikoj kun ĉiuj ties sekvoj) estas:

  • Duobla transira traduko kun Esperanto kiel interlingvo.
  • Dependosintakso.
  • Implica solvo de la semantika kaj mondoscia problemaro de vort-transiro.

La unua solvo provis uzi sciobankon de vortrilatoj en la interlingvo. La posta solvo uzis lingvoparajn sciobankojn el paralelaj tekstoj en la interlingvo kaj po unu el la fontaj kaj celaj lingvoj (t.n. Dulingva Sciobanko). Ĉi tiu solvo estas ankoraŭ nun avangarda kompare kun la traduksistemoj disponeblaj en la merkato.

La projekto ampleksis ĉ. 50 homjarojn da laboro.

Mi, kiu verkas ĉi tiun resumon kunlaboris en BSO de 1985 ĝis 1992, en la finaj monatoj de DLT kiel projektestro.

Klaus Schubert
klaus.schubert@flensburg.netsurf.de
schubert@fhf-tue.com

Esenca bibliografio:

Witkam, A. P. M. (1983): Distributed Language Translation. Feasibility Study of a Multilingual Facility for Videotex Information Networks. Utrecht: BSO [la preparstudo]

Papegaaij, Bart C. (1986): Word Expert Semantics. Red. V. Sadler kaj A. P. M. Witkam. Dordrecht/Riverton: Foris [la semantika sistemo de DLT, unua versio kun nuresperanta sciobanko]

Schubert, Klaus (1986): Linguistic and Extra-Linguistic Knowledge. En: Computers and Translation 1: 125-152 [la tradukprocezo de DLT en plena trairo]

Schubert, Klaus (1987): Metataxis: Contrastive Dependency Syntax for Machine Translation. Dordrecht/Providence: Foris [la dependosintaksa gramatikmodelo de DLT, unulingva kaj strukturtransira]

Papegaaij, Bart kaj Klaus Schubert (1988): Text Coherence in Translation. Dordrecht/Providence: Foris [transfrazaj fenomenoj]

Maxwell, Dan, Klaus Schubert kaj Toon Witkam (red.) (1988): New Directions in Machine Translation. Dordrecht/Providence: Foris [konferencvolumo de antaŭ-Coling-konferenco en Budapeŝto en 1988]

Schubert, Klaus (1989): An Unplanned Development in Planned Languages. En: Klaus Schubert (kun Dan Maxwell( (red.): Interlinguistics. Berlin/New York: Mouton de Gruyter, 249-274 [esperanta vortgramatiko]

Sadler, Victor (1989): Working with Analogical Semantics. Dordrecht/Providence: Foris [la plej kompleta prezento de la semantika modelo de DLT, dua version kun Dulingva Sciobanko]

Maxwell, Dan kaj Klaus Schubert (red.) (1989): Metataxis in Practice. Dordrecht/ Providence: Foris [aplikoj de la dependosintaksa modelo al aro da lingvoj; enhavas i.a. dependosintakson de Esperanto]

Sadler, Victor (1990): Machine Translation Project Reaches Watershed. En: Language Problems and Language Planning 15 [enhavas pliajn detalajn bibliografiajn (!) indikojn]Schubert, Klaus (1992): Esperanto as an Intermediate Language for Machine Translation. En: John Newton (red.): Computers in Translation. London/New York: Routledge, 78-95



Fonto: http://ourworld.compuserve.com/homepages/profcon/e_dlt.htm

Scienca kaj Teknika Esperanto-Biblioteko, STEB: http://www.eventoj.hu