Daugiakalbių tekstynų naudojimas ir taikymas

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Daugiakalbių tekstynų naudojimas ir taikymas
Alternative Title:
The Usage and application of multilingual corpora
In the Journal:
Darbai ir dienos [Deeds and Days]. 2006, t. 45, p. 41-62. Vertimų pasaulyje
Keywords:
LT
Lygiagretusis/palyginamasis tekstynas.
EN
Parallel / comparable corpora; Usage/application of corpora.
Summary / Abstract:

LTStraipsnyje aprašyti daugiakalbių tekstynų tipai, jų sudarymo principai, lygiagretinimo programos, tų tekstynų naudojimo ir taikymo sritys. Išsamiau aprašytas Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centre sudaryti lygiagretieji tekstynai, jų pritaikymo galimybės, naudojama lygiagretinimo programa. Daugiakalbiai tekstynai suteikia galimybę tyrinėti tarpkalbinius dalykus palyginant tam tikrą kalbos reiškinį dviejose ar daugiau kalbų. Daugiakalbiai tekstynai gali būti palyginamieji ir lygiagretieji. Pastarieji gali būti vienakrypčiai ir dvikrypčiai. Lygiagrečiuosius tekstynus sudaro originalo ir vertimo tekstai, sulygiuoti papastraipiui ar pasakiniui. Šie tekstynai dažniausiai naudojami vertimų studijose. Lygiagretieji tekstynai gali būti dvikalbiai ir daugiakalbiai. Palyginamieji tekstynai gali būti sudaryti iš panašios tematikos verstų ir neverstų tos pačios kalbos tekstų arba iš panašios tematikos verstų ir neverstų skirtingų kalbų tekstų. Šie tekstynai taikomi vertimo atitikmenims rinkti, terminų ar kitokių leksinių vienetui vartosenai tirti, kalboje atsispindinčiai kultūrai tyrinėti. Tekstai lygiagretinami naudojant specialias programas. Jos paprastai remiasi statistiniais metodais. Lygiagretinimo procesas dažniausiai sudarytas iš trijų etapų: lygiagretinimo pastraipų, sakinių ir žodžių ar frazių lygmeniu. Daugiakalbiai tekstynai naudojami kalboms mokyti(s), vertimo atitikmenims gauti, kalboms lyginti, įvertinant ir kuriant automatinio vertimo sistemas. [Iš leidinio]Reikšminiai žodžiai: Daugiakalbis tekstynas; Tekstyno naudojimas ir taikymas; Lygiagretusis/palyginamasis tekstynas; Multilingual corpora; Usage/application of corpora; Parallel / comparable corpora.

ENThe main point of the paper is to introduce multilingual corpora as useful and powerful tools for translation research. The paper describes the main types of multilingual corpora, the principles of compilation, automatic alignment programmes and the application of corpora. Many researches point out the advantages of multilingual corpora for various monolingual and multilingual linguistic analyses, whilst the practice of multilingual corpora in Lithuanian translation studies is still a new field of research. This paper provides an introduction to the most important steps in the process of compiling the multilingual corpus in the Centre of Computational Linguistics at Vytautas Magnus University. The online corpus consists of 3 parts: English-Lithuanian parallel corpus (this part contains 6,768 parallel sentences) and Czech-Lithuanian (4,1881 parallel sentences), Lithuanian-Czech (693 parallel sentences) parallel corpus. We introduce the development of software and search possibilities of this corpus. The article exemplifies the usage of the multilingual corpus and contrasts that with the usage of traditional bilingual dictionaries. This corpus is still developed, and the most recent extensions, such as adding more languages and other text types, are presented in this paper.

ISSN:
1392-0588; 2335-8769
Related Publications:
Permalink:
https://www.lituanistika.lt/content/7068
Updated:
2018-12-20 23:10:40
Metrics:
Views: 55    Downloads: 11
Export: