High quality syntactic annotated corpus of Lithuanian - VILSINTEKS

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Anglų kalba / English
Title:
High quality syntactic annotated corpus of Lithuanian - VILSINTEKS
Alternative Title:
Aukštos kokybės sintaksiškai anotuotas lietuvių kalbos tekstynas VILSINTEKS
In the Journal:
Acta linguistica Lithuanica. 2015, t. 73, p. 252-267
Keywords:
LT
Žodžių jungimas. Sakiniai. Sakinio dalys / Word phrases. Sentences. Sentence parts.
Summary / Abstract:

LTStraipsnyje aptariamas dviem lygmenimis atliekamas anotavimas, naudojamas aukštos kokybės anotuotam lietuvių kalbos tekstynui sukurti. Išsami informacija apie sakinį nurodoma lentelėje, o sintaksinė sakinio struktūra nubraižoma grafiškai. Naudojamasi kitų kalbų patirtimi, atsižvelgiant į specifinius lietuvių kalbos bruožus. Medžio nepakankamumas vaizduojant lietuvių kalbos sakinių sintaksine struktūrą parodomas statistiniu metodu anotuotų sakinių pavyzdžiais. Straipsnyje taip pat aiškiai pabrėžiamas anotuoto tekstyno, kuriame bus sukaupta išsami informacija, kūrimo tikslas. Pateikiami anotuotų sakinių pavyzdžiai, atspindintys specifinius lietuvių kalbos bruožus. [Iš leidinio]Reikšminiai žodžiai: Grafu; Medis vaizduojant lietuvių kalbos sakinius; Medžio nepakankamumas vaizduojant lietuvių kalbos sakinius; Sakinio struktūros vaizdavimas; Sakinio struktūros vaizdavimas grafu; Sintaksiškai anotuotas tekstynas; Tekstyno anotavimo lygmenys; Tekstyno kūrimo tikslas; Goal of the syntactic annotated corpus; Graph representation of the syntactic; Insufficiency of tree-representation for Lithuanian sentences; Layers of annotation; Layers of annotation in the Lithuanian corpus; Lithuanian corpus; Structure; Syntactic annotated corpus; Tree-representation for Lithuanian sentences.

ENThis paper presents a twofold annotation, which is used for the high quality annotation of the Lithuanian corpus. Comprehensive information about a sentence is given in a table and the syntactic structure of a sentence is presented in a picture. The experience of other languages is being used, and specific features of the Lithuanian language are taken into account. The insufficiency of the tree-representation for the syntactic structure of Lithuanian sentences is shown through the statistically annotated examples. The goal of the creation of the annotated corpus bearing exhaustive information is also clearly emphasized. The examples of the annotated sentences are given, which reflect the specific features of the Lithuanian language. [From the publication]

ISSN:
1648-4444
Related Publications:
Permalink:
https://www.lituanistika.lt/content/55350
Updated:
2019-01-18 15:19:24
Metrics:
Views: 19
Export: