Automatinis lietuvių kalbos veiksmažodžių grupių atpažinimas

RinkinysMokslo publikacijos / Scientific publications
Publikacijos rūšisKnygos dalis / Part of the book
KalbaLietuvių kalba / Lithuanian
AntraštėAutomatinis lietuvių kalbos veiksmažodžių grupių atpažinimas
Kita antraštėAutomatic verb phrases recognition in the Lithuanian language
Autoriai
KnygojeInformacinės technologijos : konferencijos pranešimų medžiaga: 2005 m. sausio mėn. 26-27 d. T. 1 . 2005, p. 315-320
Reikšminiai žodžiai
LTVeiksmažodžių junginiai; Tarinys; Automatinis kalbos atpažinimas; Sintaksinė analizė
ENVerb phrase; Redicate; Automatic recognition; Syntax analysis
Santrauka / Anotacija

LTStraipsnyje pristatomi bandymai automatiškai nustatyti lietuvių kalbos veiksmažodžių grupes. Pirmiausia analizuoti tik sudėtinio tarinio junginiai. Trumpai pristatytos problemos, susijusios su tarinių nustatymu, klasifikacija ir automatiniu atpažinimu morfologiškai anotuotuose tekstuose. Aprašyta, kaip naudojant tekstyną buvo aptikti veiksmažodžių jungimosi dėsningumai ir sudarytos veiksmažodžių junginius aprašančios taisyklės. Straipsnyje aprašyti statistiniai tyrimai, kuriais nustatyta, kad veiksmažodžių junginiai dabartinėje lietuvių kalboje yra pasiskirstę pagal Puasono skirstinį. Atliekant tyrimą pastebėta, kad 500 000 žodžių apimties elektroniniai tekstai – pakankama imtis veiksmažodžių junginiams analizuoti. Nustatyta, kad automatiškai galima skirti 40 grupių, kurios apima susijusias veiksmažodžių formas, pvz., tariamoji nuosaka, bendratis ir bendratis (norėčiau eiti pasivaikščioti); dalyvis, asmenuojamoji forma ir bendratis (galima buvo tikėtis) ir pan. Ilgiausi nustatyti veiksmažodžių junginiai yra keturžodžiai. Dažniausiai veiksmažodžių junginiai yra dvižodžiai arba trižodžiai. Remiantis sudarytu taisyklių rinkiniu, sukurtas veiksmažodžių junginių sintaksinis analizatorius, kuris veiksmažodžių junginius atpažįsta 95 proc. tikslumu ir morfologiškai vienareikšmina atpažintus junginius. [Iš leidinio]

ENThe first attempts to recognise Lithuanian language verb phrases automatically are presented in this article. Research is restricted to complex predicate groups. The problems related to predicates finding, classification and automated recognition in annotated texts are briefly introduced here as well. We describe our own way of finding the consistent patterns of predicate conjugations in the Lithuanian Corpora and creating verb phrase syntax rules. The results of statistical evaluation and of finding a reliable set of texts for adequate syntax analysis, and also estimating the longest possible verb phrase length the forms complex predicate,[12] are provided in this article. Forty different group models describing complex predicates in the Lithuanian language were determined. Using this 40 rules list in verb phrases recognition gives us a precision rate of 95 %. We are planning to apply the extracted syntax rules and reuse created syntax analysis and the Lithuanian verb phrases recognition tool in the Dependency Grammar parser of the Lithuanian language.

ISBN9955097884
Mokslo sritisKalbotyra / Linguistics
Susijusios publikacijos
Nuoroda į įrašą https://www.lituanistika.lt/content/1598
Atnaujinta2013-04-28 15:31:10
Metrika Peržiūros: 4