Bendrinės lietuvių kalbos daiktavardžių ir būdvardžių kirčiavimo struktūrinis modelis, algoritmas ir realizacija

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Bendrinės lietuvių kalbos daiktavardžių ir būdvardžių kirčiavimo struktūrinis modelis, algoritmas ir realizacija
Alternative Title:
Accentuation of Lithuanian nouns and adjectives: structural model, algorithm and implementation
In the Journal:
Kalbų studijos [Studies About Languages]. 2004, Nr. 6, p. 72-76
Notes:
LDB Open.
Keywords:
LT
Algoritmas; Automatinis daiktavardžių ir būdvardžių kirčiavimas; Daiktavardžių ir būdvardžių kirčiavimas; Kirčiavimo struktūrinis modelis; Lietuvių kalba; Strūktūrinis modelis.
EN
Accentuation of Lithuanian nouns and adjectiv; Algorithm; Automatic accentuation of Lithuanian nouns and adjectives; Lithuanian language; Structural model.
Summary / Abstract:

LTLietuvių kalbos vardažodžių (ir ne tik jų) kirčiavimas išsamiai išanalizuotas, neblogai kodifikuotas ir aprašytas daugelio lietuvių kalbininkų, tam skirta ne viena įvairaus pobūdžio knyga ar vadovėlis. Vis dėlto kalbos technologijų darbuose pasigendama išsamaus struktūrinio lietuvių kalbos kirčiavimo modelio, be kurio neįmanomi kokybiški šnekos sintezės programiniai produktai, negalima parengti modernių kompiuterinių mokomųjų kirčiavimo programų, kalbos vartotojai neturi šiuolaikinių galimybių greitai pasitikrinti, ar taisyklingai kirčiuoja konkrečius žodžius. Pranešime pristatoma tik viena mūsų kuriamos kompiuterinės programos dalis – veikiantis daiktavardžių ir būdvardžių kirčiavimo algoritmas ir svarbiausia jo sudedamoji dalis – formalizuota kirčiavimo taisyklių medžių struktūra. Aptariamos pagrindinės problemos, kurios iškilo įprastas lingvistines taisykles pritaikant kuriamuose algoritmuose. Nagrinėjama sąveika su morfologinės ir leksinės informacijos duomenų bazėmis. Pateikiami preliminarūs programos testavimo rezultatai ir jų gerinimo būdai. Analizuojamas galimybės, leisiančios patobulinti kai kurias programos dalis. Darbe pristatomas veikiantis daiktavardžių ir būdvardžių kirčiavimo algoritmas ir svarbiausia jo sudedamoji dalis – formalizuota medžio pavidalo kirčiavimo taisyklių struktūra.Pateikiami struktūrinio modelio sudarymo principai, pagrindžiamas jo tinkamumas kurti automatinio lietuvių kalbos kirčiavimo algoritmus. Aptariamos pagrindinės problemos, kurios iškilo įprastas lingvistines taisykles pritaikant kuriamuose algoritmuose. Nagrinėjama sąveika su morfologinės ir leksinės informacijos duomenų bazėmis. Pateikiamas preliminarus automatinio kirčiavimo tikslumo įvertinimas, gautas kirčiuojant daugiau nei 24 mln. daiktavardžių beveik 8 mln. būdvardžių, esančių VDU tekstyne, ir kirčiavimo tikslumo gerinimo būdai. Analizuojamos galimybės, leisiančios patobulinti kai kurias algoritmo dalis. [Iš leidinio]

ENThis paper describes an algorithm of automatic accentuation of Lithuanian nouns and adjectives. The algorithm incorporates the procedure of morphological analysis, and the procedure of word segmentation into syllables. It uses accentuation thesaurus, and incorporates tree-structured accentuation knowledge. Paper shows the feasibility of such tree-structured model for creating practical automatic accentuation tool. The algorithm was tested on 24 and 7,9 millions of nouns and adjectives respectively taken from VMU text corpus. It showed accuracy levels superior to 80%. [From the publication]

ISSN:
1648-2824; 2029-7203
Related Publications:
Permalink:
https://www.lituanistika.lt/content/29142
Updated:
2018-12-17 11:24:44
Metrics:
Views: 24    Downloads: 1
Export: