LTDisertacijoje pasiūlytos dvi metodikos, kuriomis remiantis galima: 1) įvertinti įvairių stilių lietuvių kalbos tekstų sintaksinį sudėtingumą, 2) nustatyti lietuvių kalbos tekstų informatyvumą automatiniu ar pusiau automatiniu būdu pagal du įverčius – leksinį tankį ir sintaksinį sudėtingumą. Tekstų sintaksinio sudėtingumo nustatymo metodika darbe laikoma dalimi bendros tekstų informatyvumo nustatymo metodikos. Tyrimas paremtas skirtingų stilių – administracinės literatūros, grožinės literatūros, bendrosios periodikos ir specialiosios periodikos – lietuvių kalbos tekstų analize. Tiriamosios medžiagos šaltinis – lietuvių kalbos sintaksiškai anotuoto tekstyno ALKSNIS tekstai. Tyrimą sudaro trys etapai: 1) tekstų leksinio tankio analizė, 2) tekstų sintaksinio sudėtingumo analizė, 3) tekstų informatyvumo įvertinimas. Atlikus pusiau automatinę skirtingų stilių lietuvių kalbos tekstų leksinio tankio analizę, nustatyta, kad didžiausias vidutinis leksinis tankis būdingas tirtiems administraciniams tekstams, mažiausias – grožinės literatūros tekstams. Sintaksinio sudėtingumo tyrimas parodė, kad aukščiausiais sintaksinio sudėtingumo rodikliais pasižymi bendrosios periodikos tekstai, žemiausiais – administraciniai tekstai. Pasirėmus dviejų informatyvumo įverčių – leksinio tankio ir sintaksinio sudėtingumo – analizės rezultatais apskaičiuota, kad aukščiausi informatyvumo rodikliai būdingi administraciniams ir bendrosios periodikos tekstams, žemiausi – grožinės literatūros tekstams.
ENThe dissertation proposes two methodologies that can be used: 1) to determine the syntactic complexity of Lithuanian texts of different styles, 2) on the basis of two characteristics of the informativity of texts, i.e. lexical density and syntactic complexity, to determine the informativity of Lithuanian texts automatically and semi-automatically. Methodology for determining the syntactic complexity of texts is considered as a part of the methodology used to determine the informativity of texts. The research is based on the analysis of Lithuanian texts of different styles, i.e. administrative literature, fiction, general periodicals, and special periodicals. The source of the research material is texts of the Lithuanian syntactically annotated corpus ALKSNIS. The research includes three stages: 1) the analysis of the lexical density of texts, 2) the analysis of the syntactic complexity of texts, 3) the evaluation of the informativity of texts. The semi-automatic analysis of the lexical density of Lithuanian texts of the different styles showed that administrative texts have the highest average lexical density and fiction texts have the lowest average lexical density. The analysis at the syntactic level revealed that the highest syntactic complexity is characteristic of texts of general periodicals and the lowest syntactic complexity is characteristic of administrative texts. The highest indexes of informativity were found in the groups of administrative texts and texts of general periodicals, and the lowest indexes of informativity were found in the group of fiction texts.