×

We use cookies to help make LingQ better. By visiting the site, you agree to our cookie policy.


image

Esperanta Retradio 2020, Matematika Esperanto

Matematika Esperanto

Ekzistas proksimume 6.500 lingvoj en la mondo, sed maŝinaj tradukiloj kiuj baziĝas sur artefarita inteligenteco, povas labori kun manpleno da ili. La maŝintradukilo kiu ekkonas sufiĉe grandan nombron da ili, estas tiu de Guglo, kiu akceptas iom pli ol 100 lingvojn.

Kial ĝi ne atingas la aliajn? Ĉefe ĉar mankas datumoj por lerni kiel tio funkcias. Sistemoj, kiuj baziĝas sur algoritmoj por artefarita inteligenteco, bezonas datumojn, el kiuj ili povas lerni, kaj ĉe aŭtomataj tradukiloj ili utiligas por funkcii la informojn kiuj estas disponeblaj en la interreto.

Ekzemple la retejo de la Eŭropa Parlamento estas la nesuperebla traduka datumaro inter eŭropaj lingvoj, ĉar ĉiuj preskriboj kaj direktivoj de EU devas esti tradukataj al la oficialaj lingvoj de la 27 membroŝtatoj de EU. Tio estas miloj da dokumentoj, el kiuj algoritmoj povas eltiri ekzemplojn, kiel tiuj frazoj kaj esprimoj antaŭe estis tradukitaj inter tiuj lingvoj. Ju pli granda estas la datumaro, des pli bonaj estas la tradukoj.

Sed kio okazas, se tiuj datumoj ne estas disponeblaj, ĉar la skribita pakumo ne estas ciferecigita aŭ tre limigita? "Por aŭtomata tradukilo estas tre simple, traduki inter la angla kaj la hispana, ĉar ekzistas multaj ekzemploj. Sed se oni interalie volas traduki ion por kio oni disponas pri multe malpli da fontmaterialoj, kiel ekzemple la ĉeĥa kaj la vaska lingvoj, tiam la afero estas multe pli komplika", klarigas Marta Costa-Jussá, kiu estas esploristino ĉe la Politeknika Universitato de Katalunio. La situacio signifas, ke la plej ofte parolataj lingvoj disponas pri pli kaj pli da fontmaterialoj, sed ke ili postlasas tiun malplimulton de lingvoj. La ideo de la esploristino por solvi tion, estas krei "matematikan Esperanton", do "universalan reprezenton de la lingvo" kiu estos disvolvita por maŝinoj. Estas la celo ke aŭtomataj tradukiloj ne bezonu ekzemplojn de la sama teksto en du specifaj lingvoj por lerni kiel oni traduku inter ili.

La projekto nomiĝas LUNAR (dumviva universala lingvoreprezento), ĝi transskribas de lingvo al teksto kaj havas jam kelkajn prototipojn. La Eŭropa Esplorkonsilantaro jam atribuis al ĝi financrimedojn en la sumo de 1,5 milionoj da eŭroj, por esplori la potencialon de la "matematika Esperanto" dum la venontaj kvin jaroj. Entute 15 esploristoj partoprenos en la studo kaj komencos en decembro. La vaska lingvo estis unu el la lingvoj, kiujn la esploristino menciis kiel ekzemplon kiam temis pri la ricevo de la financrimedoj.

"Esperanto estas konsiderata simpla lingvo, kiu funkcias kiel universala lingvo. En nia projekto ne temas pri lingvo kun homaj reguloj, sed pri la kreado de matematika kaj aŭtomata reprezento, kiu estas komuna por ĉiuj lingvoj", klarigas la esploristino. "Tiu matematika reprezento nuntempe estas malsama por ĉiu unuopa lingvo. Se ni tamen sukcesos egaligi tiun reprezenton, ni povas multe profiti de tio, ĉar ne plu estos tie grave, havi tradukajn fontmaterialojn inter ĉiuj lingvoj."


Matematika Esperanto Mathematical Esperanto Математический эсперанто

Ekzistas proksimume 6.500 lingvoj en la mondo, sed maŝinaj tradukiloj kiuj baziĝas sur artefarita inteligenteco, povas labori kun manpleno da ili. La maŝintradukilo kiu ekkonas sufiĉe grandan nombron da ili, estas tiu de Guglo, kiu akceptas iom pli ol 100 lingvojn.

Kial ĝi ne atingas la aliajn? Ĉefe ĉar mankas datumoj por lerni kiel tio funkcias. Sistemoj, kiuj baziĝas sur algoritmoj por artefarita inteligenteco, bezonas datumojn, el kiuj ili povas lerni, kaj ĉe aŭtomataj tradukiloj ili utiligas por funkcii la informojn kiuj estas disponeblaj en la interreto.

Ekzemple la retejo de la Eŭropa Parlamento estas la nesuperebla traduka datumaro inter eŭropaj lingvoj, ĉar ĉiuj preskriboj kaj direktivoj de EU devas esti tradukataj al la oficialaj lingvoj de la 27 membroŝtatoj de EU. Tio estas miloj da dokumentoj, el kiuj algoritmoj povas eltiri ekzemplojn, kiel tiuj frazoj kaj esprimoj antaŭe estis tradukitaj inter tiuj lingvoj. Ju pli granda estas la datumaro, des pli bonaj estas la tradukoj.

Sed kio okazas, se tiuj datumoj ne estas disponeblaj, ĉar la skribita pakumo ne estas ciferecigita aŭ tre limigita? "Por aŭtomata tradukilo estas tre simple, traduki inter la angla kaj la hispana, ĉar ekzistas multaj ekzemploj. Sed se oni interalie volas traduki ion por kio oni disponas pri multe malpli da fontmaterialoj, kiel ekzemple la ĉeĥa kaj la vaska lingvoj, tiam la afero estas multe pli komplika", klarigas Marta Costa-Jussá, kiu estas esploristino ĉe la Politeknika Universitato de Katalunio. La situacio signifas, ke la plej ofte parolataj lingvoj disponas pri pli kaj pli da fontmaterialoj, sed ke ili postlasas tiun malplimulton de lingvoj. La ideo de la esploristino por solvi tion, estas krei "matematikan Esperanton", do "universalan reprezenton de la lingvo" kiu estos disvolvita por maŝinoj. Estas la celo ke aŭtomataj tradukiloj ne bezonu ekzemplojn de la sama teksto en du specifaj lingvoj por lerni kiel oni traduku inter ili.

La projekto nomiĝas LUNAR (dumviva universala lingvoreprezento), ĝi transskribas de lingvo al teksto kaj havas jam kelkajn prototipojn. La Eŭropa Esplorkonsilantaro jam atribuis al ĝi financrimedojn en la sumo de 1,5 milionoj da eŭroj, por esplori la potencialon de la "matematika Esperanto" dum la venontaj kvin jaroj. Entute 15 esploristoj partoprenos en la studo kaj komencos en decembro. La vaska lingvo estis unu el la lingvoj, kiujn la esploristino menciis kiel ekzemplon kiam temis pri la ricevo de la financrimedoj.

"Esperanto estas konsiderata simpla lingvo, kiu funkcias kiel universala lingvo. En nia projekto ne temas pri lingvo kun homaj reguloj, sed pri la kreado de matematika kaj aŭtomata reprezento, kiu estas komuna por ĉiuj lingvoj", klarigas la esploristino. "Tiu matematika reprezento nuntempe estas malsama por ĉiu unuopa lingvo. Se ni tamen sukcesos egaligi tiun reprezenton, ni povas multe profiti de tio, ĉar ne plu estos tie grave, havi tradukajn fontmaterialojn inter ĉiuj lingvoj."