Intonuoto garsyno kūrimo principai

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Intonuoto garsyno kūrimo principai
Alternative Title:
Principles of development of the intonational annotated spoken corpus
In the Journal:
Žmogus ir žodis [Man and the Word]. 2013, 1, p. 101-110
Keywords:
LT
Anotavimas; Garsynas; Intonacija; Sakytinė kalba.
EN
Annotation; Intonation; Speech corpus; Spoken language.
Summary / Abstract:

LTKalbos reiškimosi formos – rašytinė ir sakytinė – skiriasi daugeliu lingvistinių dalykų. Skiriasi ir jų fiksavimo bei analizavimo galimybės ir priemonės. Ryškiausias skirtumas – intonacija, kuri apima daug reiškinių: kalbėjimo segmentavimą į prasminius-intonacinius vienetus, svarbesnių žodžių išryškinimą, kalbėjimo tempo kaitą, emocijų raišką. Intonacija prasčiausiai atspindima įprasta rašyba, nelengva ją ir mokslininkams tirti. Viena iš svarbiausių sėkmingo tyrimo prielaidų – tinkamas specializuoto garsyno parengimas. Garsyno kūrimas skirstomas į kelis etapus: kuo įvairesnių sakytinės kalbos pavyzdžių įrašymas, įrašų ir jų anotacijų (tekstų su tam tikrais simboliais užrašytomis garsinės kalbos ypatybėmis) pritaikymas kalbos analizės programoms, įrašų ir anotacijų susiejimas. Kiekvienam iš šių etapų keliami tam tikri reikalavimai. Pasaulio kalbininkai intonacijai skiria nemažai dėmesio, parengtas ne vienas garsynas, naudojamasi bendromis metodikomis (dėl to kalbų intonaciniai požymiai gali būti nesunkiai lyginami). Straipsnyje aprašoma intonuoto lietuvių kalbos garsyno kūrimo metodika: garsą atitinkančių tekstinių anotacijų rengimo principai, lingvistinių ir nelingvistinių elementų žymos, aptariamos žodžių akcentinio šlijimo, frazių ir sintagmų ribų nustatymo, loginį kirtį turinčio žodžio, pagrindinio tono kaitos fiksavimo principai. [Iš leidinio]

ENLanguage manifests itself in both spoken and written forms. Spoken and written language forms are different in many linguistic respects and in the methods and tools they are acquired and analyzed. Intonation is one of the most important phenomena of a spoken language. It comprises the segmentation of speech into meaningful units, emphasis of key words, fiuctuation in speech tempo, expression of emotions. Intonation is poorly represented by word orthography and thus poses many problems for intonation researchers. Specially prepared intonational speech corpus is a prerequisite for any serious intonation research. The process of compiling speech corpus can be divided into a few steps: acquisition and recording of prosody-rich utterances of spoken language, description of the content of these utterances and utterance markup with tags that describe prosodie features, automatically assigning timings to prosodie features (as a result of phone level annotation of intonational speech corpus). Every step in this process requires certain procedures to be observed and certain requirements to be met. Linguists of the world have built more than one intonational corpus, some common methodologies have been developed (this allows intonational features of different languages to be compared). This paper describes and discusses the process of building intonational annotated speech corpus of Lithuanian: tagging and labeling linguistic and extra-linguistic phenomena, cliticization, markup of phrase and sentence boundaries, determining and labeling logical stress, mark-up of fundamental frequency. [From the publication]

ISSN:
1392-8600; 1822-7805
Related Publications:
Permalink:
https://www.lituanistika.lt/content/47535
Updated:
2019-01-13 16:55:36
Metrics:
Views: 10    Downloads: 2
Export: