Priklausomybių gramatika pagrįstų lietuvių kalbos sintaksinių taisyklių išgavimas iš "Dabartinės lietuvių kalbos tekstyno"

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Knygos dalis / Part of the book
Language:
Lietuvių kalba / Lithuanian
Title:
Priklausomybių gramatika pagrįstų lietuvių kalbos sintaksinių taisyklių išgavimas iš "Dabartinės lietuvių kalbos tekstyno"
Alternative Title:
The Extraction of DG Syntactic Rules of the Lithuanian Language
Keywords:
LT
Sintaksinė taisyklė; Sintaksinė analizė.
EN
Syntactic rule; Syntactic analysis.
Summary / Abstract:

LTStraipsnyje aprašyta, kaip iš 100 mln. žodžių Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centre sudaryto Dabartinės lietuvių kalbos tekstyno buvo išgautos sintaksinės lietuvių kalbos taisyklės. Nagrinėti pagrindiniai taisyklių specifikavimo parametrai, aprašyta priklausomybių gramatika pagrįstų lietuvių kalbos išgavimo iš metodologija. Lietuvių kalbos sintaksinėms taisyklėms sudaryti buvo panaudoti tokie lingvistiniai resursai: Dabartinės lietuvių kalbos tekstynas, pusiau automatiškai paruoštas morfologiškai anotuotas lietuvių kalbos tekstynas ir morfologinis analizatorius Lemuoklis. Remiantis priklausomybių gramatika svarbu nurodyti, kuris žodis yra valdantysis, o kuris valdomasis, pvz., daiktavardžiai valdo su jais suderintus būdvardiškuosius žodžius; veiksmažodžiai valdo tam tikras gramatines formas. Aprašant sintaksinius junginius, neužtenka vien sintaksinių taisyklių. Reikalingi tokie papildomi parametrai: sintaksinė priklausomybė, įsiterpimas, žodžių tvarka ir prioritetas. Į šiuos parametrus būtina atsižvelgti, norint patikslinti sintaksines taisykles. Taisyklių išgavimas remiasi adaptuotu pattern recognition metodu. Automatiškai išgaunant taisykles reikalingi tokie etapai: tekstinių vienetų atpažinimas, automatinė morfologinė analizė ir klasifikavimas. [Iš leidinio]

ENThe need of an automatic Lithuanian language syntactic analysis was the background of this research. Concerning the processing of the Lithuanian language there are some key works in morphology level, but syntactical analysis is still lagging behind. That is the main reason why we consider formal specifications of Dependency Grammar being important for processing of the Lithuanian language. Our approach is based on corpus-based pattern recognition methods that let us extract and classify Dependency Grammar rules. [From the publication]

ISBN:
9955-09-852-X
Related Publications:
Permalink:
https://www.lituanistika.lt/content/7071
Updated:
2020-11-22 18:36:07
Metrics:
Views: 66    Downloads: 1
Export: