Statistiniai, loginiai ir kompiuterių mokymosi metodai lietuvių kalbos morfologiniam daugiareikšmiškumui riboti

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Knygos dalis / Part of the book
Language:
Lietuvių kalba / Lithuanian
Title:
Statistiniai, loginiai ir kompiuterių mokymosi metodai lietuvių kalbos morfologiniam daugiareikšmiškumui riboti
Alternative Title:
Syntactic analysis of Lithuanian Language for the Disambiguation of Morphological Ambiguity
Notes:
LDB Open.
Keywords:
LT
Morfologiniai požymiai; Morfologinės savybės; Kompiuterinės technologijos; Kompiuterių sintaksinės analizės mokymosi metodas; Morfologinis daugiareikšmiškumas; Tekstynai.
Summary / Abstract:

LTStraipsnyje aprašyti įvairūs būdai lietuvių kalbos morfologiniam daugiareikšmiškumui riboti: statistiniai, loginiai ir kompiuterių mokymosi metodai. Paaiškinta, kaip naudojant šiuos metodus galima automatiškai vienareikšminti morfologiškai daugiareikšmes formas, pvz., laimės (tai gali būti ir daiktavardžio, ir veiksmažodžio forma). Trumpai aprašyta, kas yra morfologinis daugiareikšmiškumas, dėl kokių priežasčių jis atsiranda; pristatytas VDU Kompiuterinės lingvistikos centre sudaryto morfologiškai anotuoto tekstyno kūrimo ir tvarkymo procesas, lietuvių kalbos morfologinio analizatoriaus veikimo principas. Morfologinis daugiareikšmiškumas trukdo tolesnei automatinei kalbos analizei (sintaksinei ir semantinei), todėl reikalingos priemonės, galinčios vienareikšminti. Vieni iš pirmųjų metodų, skirtų morfologiniam daugiareikšmiškumui riboti, buvo statistiniai. Jie pagrįsti kalbos dalių sekų modelio kūrimu ir jo naudojimu žodžių sekai vienareikšminti. Vėliau pritaikytas kompiuterių loginio mokymosi metodas. Naudotas ID3 algoritmas, kuris sukuria medžius, nesudėtingai perrašomus į taisyklių aibę. Pritaikius statistinius ir loginius metodus, pasiektas 90,69 proc. lietuvių kalbos morfologinio daugiareikšmiškumo ribojimo tikslumas. Dar vienas metodas morfologiniam daugiareikšmiškumui riboti – kompiuterių sintaksinės analizės mokymosi metodas. Atliekant sintaksinę analizę, nustatomi žodžių ryšiai, kartu išsprendžiamas morfologinis daugiareikšmiškumas. [Iš leidinio]

ENThe methods that have been used for solving disambiguation of morphological ambiguity of Lithuanian language are introduced in this article. These are as follows: statistical, logical, and machine learning. We claim these methods to be useful for solving automated disambiguation (e.g., word laimės (a noun or a verb)). We think that the context of a word plays a significant role in morphological disambiguation. Related problems and results of the experiment are presented in this paper.

ISBN:
9955099933
Related Publications:
Permalink:
https://www.lituanistika.lt/content/7070
Updated:
2020-11-22 18:30:24
Metrics:
Views: 34
Export: