Baltų ir slavų kalbų jungtukai : lingvostatistikos aspektas

Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Baltų ir slavų kalbų jungtukai : lingvostatistikos aspektas
Alternative Title:
Conjuctions in Lithuanian, Latvian, Russian languages
In the Journal:
Keywords:
LT
Latvių kalbos jungtukai; Lietuvių kalbos jungtukai; Rusų kalbos jungtukai; Jungiamieji žodžiai; Lingvostatistika; Tekstynai
EN
Latvian conjunctions; Lithuanian conjunctions; Russian conjunctions; Connective words; Linquastatistics; Corpus
Summary / Abstract:

LTJungtukai, kaip nesavarankiškos kalbos dalys, turi gana pastovius santykinius lingvistinės statistikos požymius tiek baltų, tiek slavų kalbose. Tačiau tų požymių skirtybės bei panašybės įvairaus dydžio imčių atžvilgiu mažiau žinomos. Straipsnyje apžvelgti tik paprastųjų jungtukų ir jungiamųjų žodžių dažninio vartojimo ypatumai lietuvių, latvių bei rusų kalbose. Patikimiausius (pamatinius) lingvistinės statistikos duomenis apie lietuvių kalbos jungtukų vartojimo intensyvumą įvairių funkcinių stilių spaudoje teikia VDU Kompiuterinės lingvistikos centras Kaune, kurio tekstynas (sukauptų tekstų imtis) – 102.857.327 žodžių pavartojimai. Apžvelgiami paprastųjų lietuvių kalbos jungtukų dažnius pagal keturias tekstyno dalis – periodiką, grožinę literatūrą, negrožinę literatūrą, dokumentų tekstus. Labai didelės imties lingvistinės statistikos rezultatai patvirtina tiesas, kurios fragmentiškai buvo žinomos: a) daugiausia jungtukų vartojama periodikos tekstuose, mažiausia – dokumentuose; b) kai kurie jungtukai (ir, kad, o, kaip) visada bus įvairiausios imties tekstu dažniniuose žodynėliuose. Tačiau tik du pirmieji atitinka išnagrinėtąją lietuvių kalbos jungtukų dažninę seką. Absoliučiai dažniausieji lietuvių kalbos jungtukai yra šie: ir (3,24°/o), kad (0,88%), o (0,49%). Rečiausiai vartojami jungtukai visumos pavartotų žodžių atžvilgiu – tartum (0,0024%), lyg (0,031%), jog (0,12%). Bet grožinės literatūros tekstuose minėtieji jungtukai yra dažni. Taigi statistikos rezultatų pagrindu modeliuojami konkretūs lietuvių kalbos jungtukų vartojimo faktai, svarbūs teorijai ir praktikai.

ENConjunctions, being subordinate language particles, exhibit rather stable relative linguistic statistical features in both Baltic and Slavic languages. However, the differences in these features and similarities in relation to samples of different sizes are less known. The article reviews only specific usage frequency of simple conjunctions and joining words in Lithuanian, Latvian, and Russian languages. The most reliable (base) linguist statistical data about intensity of use of Lithuanian language conjunctions in publications of various functional styles is provided by Vytautas Magnum University (VMU) Computer linguistics center in Kaunas, whose corpus (sample of accumulated texts) includes 102.857.327 word instances. The author reviews the frequency of simple Lithuanian language conjunctions in four parts of a corpus: periodicals, fiction, non-fiction, and documentary texts. Linguistic statistical results of a very big sample confirm truths, which were known fragmentally: a) most often conjunctions are used in periodicals, least – in documents; b) some conjunctions (ir, kad, o, kaip) shall always be most varied sample text in frequency dictionaries. However, only the first two correspond to the examined frequency sequence of Lithuanian language conjunctions. In absolute terms, most frequent Lithuanian language conjunctions are the following: ir (3,24°/o), kad (0,88%), o (0,49%). Least frequently used conjunctions in relation to all used words – tartum (0,0024%), lyg (0,031%), jog (0,12%). However, in fiction literature texts, the mentioned conjunctions are frequent. Therefore, on the basis of statistical results, the author models specific Lithuanian language use facts, which are important for both theory and practice.

ISBN:
9984-14-272-8
Permalink:
https://www.lituanistika.lt/content/4997
Updated:
2013-04-28 16:10:27
Metrics:
Views: 5