Kiekybiniai tyrimai kalbotyroje

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Kiekybiniai tyrimai kalbotyroje
Alternative Title:
Quantitative research in linguistics
In the Journal:
Keywords:
LT
Fonetika. Fonologija / Phonology; Kalbotyra / Linguistics; Statistika / Statistics; Žodžių daryba. Žodžio dalys / Word formation. Parts of a word.
Summary / Abstract:

LTStraipsnių cikle supažindinama su kiekybinių kalbos tyrimų specifika, įvairove ir jų interpretavimu. XX a. pabaigoje atsirado nemažai tekstometrinių tyrimų, kuriais siekiama išsiaiškinti kalbos elementų vartojimo dėsningumus įvairiuose tekstuose. Tokie tyrimai turi būti atliekami su didelėmis duomenų sankaupomis, todėl jiems kelią atvėrė modernių techninių priemonių duomenų apdorojimui, elektroninių tekstų sankaupų (tekstynų) radimasis. Pirmajame straipsnyje aptariama žodžių foneminės ir morfeminės struktūros analizė. Pasinaudojant statistiniais metodais galima nustatyti, kiek fonemų (garsų) sudaro rišlios kalbos žodžius, kokios struktūros žodžiai vyrauja. Lietuvių kalbos žodžių struktūrą galima analizuoti ir pagal morfemas. Teoriškai viename žodyje gali būti trys priešdėliai, sangrąžos afiksas, dvi šaknys, tarp jų dar jungiamasis balsis, trys priesagos ir galūnė, tačiau beveik 312 tūkst. žodžių analizė parodė, kad lietuvių kalbai būdingiausias žodžių modelis šaknis + galūnė. Remiantis šio tyrimo medžiaga sudaryti elektroniniai morfemų žodynai. Antrame straipsnyje aptariami realios kalbos gramatinės struktūros tyrimai, kiekybinių ir kokybinių morfologijos tyrimų sąsajos, dėmesys skiriamas statistinių kirčiuočių duomenų analizei. Trečiajame straipsnyje aptariami žodžių dažnumo tyrimai, statistinė žodžio formų analizė. Straipsniuose taip pat pristatomos kiekvienam prieinamos žodžių, tekstų analizės programos internete. Atkreipiamas dėmesys, kad netinkamai naudojant statistinius metodus, galima prieiti nepagrįstų išvadų ir rezultatų, nepastebėti prasminių kalbos ypatybių.Reikšminiai žodžiai: Dažnis; Fonetinė struktūra; Kalbotyra; Kiekybiniai tyrimai; Kiekybinis tyrimas; Morfeminė struktūra; Statistika; Statistinis metodas; Tekstynas; Žodis; Žodžio forma; Corpus; Frequency; Grammatical form; Lexeme; Morphemic structure; Phonetic structure; Quantative research; Quantitative Research in Linguistics; Statistical method; Statistics.

ENThe series of articles presents the specifics of quantitative studies of a language, their diversity and interpretation. At the end of the twentieth century, there appeared a textometry studies aimed at figuring out the regularities of the use of language elements in various texts. Such studies should be carried out with large data compilations, so the way was opened for the by modern technical means for data processing and emergence of electronic text collections (corpora). The first article discusses the analysis of the phonemic and morphemic structure of words. With the use of statistical methods, it is possible to determine the number of phonemes (sounds) forming words of a coherent language and the prevailing structure of words. The structure of words of the Lithuanian language can also be analysed in accordance with morphemes. In theory, a single word may contain three prefixes, reflexive affix, two roots, a connecting vowel between them, the three suffixes and endings; however, the analysis of nearly 312 000 words showed that the word pattern “roots + ending” is most characteristic to the Lithuanian language. Electronic morpheme dictionaries were compiled on the basis of the materials of this study. The second article discusses studies of the real language grammatical structure, relations of quantitative and qualitative morphological studies and pays attention to the statistical stress data analysis. The third article discusses the word frequency studies and statistical analysis of word forms. The articles also present publicly open word and text analysis programmes on the Internet. It is noted that the improper use of statistical methods may result in obtaining arbitrary findings and results and to overlook notional features of the language.

ISSN:
0235-7151
Related Publications:
Permalink:
https://www.lituanistika.lt/content/36564
Updated:
2018-12-17 13:11:14
Metrics:
Views: 104    Downloads: 24
Export: