Tradicinių aiškinamųjų žodynų antraštyno atnaujinimo būdas

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Tradicinių aiškinamųjų žodynų antraštyno atnaujinimo būdas
Alternative Title:
Method to update traditional explanatory dictionaries
In the Journal:
Taikomoji kalbotyra. 2021, 16, p. 42-48
Keywords:
LT
Leksikografija / Lexicography.
Summary / Abstract:

LTStraipsnyje pristatomas būdas, leidžiantis atnaujinti tradicinius suskaitmenintus žodynus, pasirėmus žodynuose pateiktų lemų palyginimu su dideliuose tekstynuose vartojama leksika. Tokiam lyginimui galimybę suteikia Hunspell platforma, kuri leidžia generuoti visas žodžio formas pagal lemą ir jai priskirtas darybos taisykles. Atlikus Dabartinės lietuvių kalbos žodyno 6-osios laidos leidimo skaitmeninės versijos lemų analizę ir palyginus ją su Jungtinio lietuvių kalbos tekstyno leksiniais duomenimis, buvo gauti du sąrašai: žodyne pristatytos, bet tekstyne neaptiktos leksikos, ir žodyne nepateiktos, bet tekstyne dažnai vartojamos leksikos. Pastarasis sąrašas pristatomas detaliai tam, kad išryškėtų, kokia leksika turėtų būti papildomi nauji žodyno leidimai. Raktažodžiai: tekstynų lingvistika; jungtinis lietuvių kalbos tekstynas; tradicinė leksikografija; dažninis sąrašas; „Hunspell“ platforma; žodynų atnaujinimas. [Iš leidinio]

ENIn the paper the method is presented how to update traditional digitalised dictionaries based on comparison of the dictionary lemmas and a big corpus. Hunspell platform is used for generation of all the word forms from the dictionary lemmas. 6th edition of The Dictionary of Modern Lithuanian was chosen for its comparison with the lexical data from The Joint Corpus of Lithuanian. The outcome of the comparison was two lists of non-overlapping lexis: the list of the dictionary lemmas unused in the present-day Lithuanian and the list of the dictionary gaps, i.e., frequently used words and word forms ignored by the dictionary. The latter is discussed in greater detail to give lexicographers a clue for updates. Keywords: corpus linguistics; a joint corpus of Lithuanian; traditional lexicography; frequency list; Hunspell platform; dictionary updates. [From the publication]

DOI:
10.15388/Taikalbot.2021.16.3
ISSN:
2029-8935
Related Publications:
  • Dabartinės lietuvių kalbos gramatika / Vytautas Ambrazas, Kazimieras Garšva, Aleksas Girdenis, Evalda Jakaitienė, Pranas Kniūkšta, Stasė Krinickaitė, Vitas Labutis, Adelė Laigonaitė, Elena Oginskienė, Juozas Pikčilingis, Albertas Ružė, Nijolė Sližienė, Kazys Ulvydas, Vincas Urbutis, Adelė Valeckienė, Elena Valiulytė. Vilnius : Mokslo ir enciklopedijų leidybos institutas, 2005. 745 p.
  • Lietuvių kalbos morfologija atvirojo kodo Hunspell platformoje / Virginijus Dadurkevičius. Bendrinė kalba. 2017, 90, 1 pdf (17 p.).
Permalink:
https://www.lituanistika.lt/content/99072
Updated:
2022-12-01 15:08:12
Metrics:
Views: 21    Downloads: 4
Export: