Labai dažnų lietuvių kalbos žodžių ir žodžių formų ypatybės

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Labai dažnų lietuvių kalbos žodžių ir žodžių formų ypatybės
Alternative Title:
Characteristic Features of the Most Frequent Words and Wordforms in Lithuanian
In the Journal:
Lituanistica . 2005, Nr. 1, p. 48-55
Notes:
LDB Open.
Keywords:
LT
Labai dažnas žodis; Labai dažnų žodžių formų ypatybės; Funkcinė žodžių vartosena; Tekstų tipai; Tekstynų lingvistika; Žodžių dažnumas; Žodžio ilgis
Summary / Abstract:

LTStraipsnio tikslas – aptarti dažniausių lietuvių kalbos žodžių ir žodžių formų savybes ir jų svarbą teksto analizei, nes dažniausios žodžių formos nuo retesnių skiriasi ne tik ypač dideliu dažnumu, bet ir kitomis tik joms būdingomis ypatybėmis. Labai dažni žodžiai ir labai dažnos žodžių formos nustatytos remiantis Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centro Dabartinės lietuvių kalbos tekstynu, o jų ypatybės vertinamos taikant statistinius metodus. Labai dažnų žodžių ir labai dažnų formų statistinė analizė parodė, kad labai dažni žodžiai ir labai dažnos formos turi tik jiems būdingų savybių, neįprastų retesniems žodžiams, todėl juos tikslinga laikyti atskira žodžių grupe, kuri turėtų būti analizuojama atskirai. Remiantis statistiniais žodžių pasiskirstymo duomenimis, galima daryti išvadą, kad svarbiausia labai dažnų žodžių ir labai dažnų formų paskirtis nepriklausomai nuo to, kokiai kalbos daliai jie priklauso (pagrindinei ar tarnybinei), yra susijusi su funkcine jų vartosena, o ne su turinio raiška. Todėl labai dažni žodžiai ir labai dažnos formos gali būti įvardijami kaip funkciniai žodžiai. Dažniausių žodžių ir dažniausių formų analizė taip pat parodė, kad labai dažnų žodžių ir labai dažnų formų pasiskirstymas tekstuose nėra chaotiškas ar atsitiktinis. Būdami dažniausi struktūriniai teksto vienetai, jie yra tiesiogiai susiję su teksto funkcijomis, todėl kartu su kitomis formaliomis teksto ypatybėmis jie gali būti laikomi reikšmingais teksto funkcinių ypatybių rodikliais

ENThe aim of the article is to discuss the characteristic features of the most frequent words and wordforms in Lithuanian as well as their significance to text analysis as the most frequent wordforms differ from less frequent ones not by especially extensive frequency but also by other characteristic properties. Very frequent words and wordforms were defined on the basis of Contemporary Lithuanian Language Corpus issued by the Computer Linguistics Centre of Vytautas Magnus University, and their peculiarities were assessed by statistical methods. Statistical analysis of very frequent words and wordforms revealed that very frequent words and wordforms have particular attributes that are not characteristic to less frequent words, thus they should be regarded as a separate group of words that should be separately analysed. On the basis of data regarding statistical word distribution, a conclusion may be made that the most important purpose of most frequent words and wordforms is related to their functional use rather than expression of content irrespective of the type of language to which it is attributed (main or administrative). Therefore, very frequent word or wordforms may be regarded to as functional words. Analysis of the most frequent words and forms also revealed that distribution of the most frequent words and wordforms in texts isn’t chaotic or incidental. As they are the most frequent textual units, they are directly related to text functions, thus together with other formal text peculiarities they may be regarded as significant indicators of functional properties of text.

ISSN:
0235-716X, 2424-4716
Related Publications:
Permalink:
https://www.lituanistika.lt/content/46
Updated:
2018-12-17 11:31:19
Metrics:
Views: 25    Downloads: 2