Dabartinės rašomosios lietuvių kalbos dažninis žodynas ir jo bazė

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Dabartinės rašomosios lietuvių kalbos dažninis žodynas ir jo bazė
In the Journal:
Acta linguistica Lithuanica. 2002, t. 46, p. 19-37
Notes:
LDB Open.
Keywords:
LT
lietuvių kalbos elektroninė duomenų bazė; dabartinės rašomosios lietuvių kalbos dažninis žodynas; Kauno VDU lietuvių kalbos tekstynas.
EN
the electronic databases for Lithuanian; the Frequency Dictionary of Modern Written Lithuanian; the Lithuanian Language Corpus of Kaunas University.
Summary / Abstract:

LTElektroninių dabartinės lietuvių kalbos duomenų bazių nėra daug, didžiausios iš jų yra V. Žilinskienės ir L. Grumadienės Dabartinės rašomosios lietuvių kalbos dažninio žodyno (1200000 žodžių pavartojimų) ir Vytauto Didžiojo universiteto Lietuvių kalbos tekstynas (60000000 žodžių pavartojimų). Lituanistikoje dar nėra tinkamos praktikos naudotis tiek elektroninėmis dabartinės kalbos duomenų bazėmis, tiek lingvostatistiniais leidiniais. Visų pirma, per mažai pratinama taip dirbti Lietuvos aukštosiose mokyklose, bet yra ir kita medalio pusė - per maža viešai prieinamų elektroninių lietuvių kalbos duomenų bazių. Viena iš atsilikimo priežasčių yra ir ta, kad elektroninės duomenų bazės nėra įteisinamos kaip autorinis darbas. Viena iš aktualiausių problemų Lietuvoje, susijusių su elektroninėmis duomenų bazėmis, yra jų sudarymo koncepcijos silpnumas: dažnai elektroninėmis duomenų bazėmis numatoma naudotis tik kaip elektronine forma pateiktu tekstu, nenumatant kompiuterinių technologijų pritaikymo duomenims apdoroti. Lituanistai turėtų susitarti dėl elektroninių duomenų bazių, kuriose naudojami specifiniai ženklai, pvz., senųjų raštų, transkribuotų tarmių tekstų, nes neretai tenka iš naujo perrinkti straipsnius su tokio tipo pavyzdžiais. Dabar leidžiami tarmių žodynai, tarmių tekstai, nors ir būdami elektroninės formos, yra tik spaustuvės modernėjimo ženklas, nes jų tekstais naudotis kaip elektronine duomenų baze neįmanoma. Nesant lituanistų susitarimo dėl bendros kodavimo sistemos viešas naudojimasis elektroniniais duomenų bankais labai apsunkinamas ir ribotas.

ENThere are few electronic databases for Lithuanian. The largest are the Frequency Dictionary of Modern Written Lithuanian, compiled by V. Žilinskienė and L. Grumadienė, and the Lithuanian Language Corpus of Kaunas University. The former is presented in detail here: the principles of its compilation and its possible uses are discussed, and the hitherto published work in statistical linguistics based on it is briefly characterised. The main problems in connection with the databases for modern Lithuanian are: (1) their insufficient differentiation (they reflect only the written, not the spoken language), (2) their not being optimally used, as the Lithuanian scholarly community lacks the preparation needed for working with such tools, and (3) the fact that the efforts of scholars compiling them receive too little public recognition and are not valued as original scholarly achievements. [From the publication]

ISSN:
1648-4444
Related Publications:
Permalink:
https://www.lituanistika.lt/content/18474
Updated:
2018-12-17 11:02:12
Metrics:
Views: 19    Downloads: 2
Export: