Pradžia į begalybę : mašininis vertimas ir lietuvių kalba

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Pradžia į begalybę : mašininis vertimas ir lietuvių kalba
Alternative Title:
Opening to Infinity: Machine Translation and Lithuanian Language
In the Journal:
Darbai ir dienos [Deeds and Days]. 2006, t. 45, p. 7-18. Vertimų pasaulyje
Keywords:
LT
Morfologija / Morphology; Vertimas / Translation.
Summary / Abstract:

LTMašininis vertimas yra kompleksinis uždavinys, apimantis teorinius ir praktinius įvairių mokslo sričių metodus: informacinių technologijų, lingvistikos, psichologijos, filosofijos. Verčiant automatiškai labai susimažėja finansinės ir laiko sąnaudos vertimui. Galima skirti penkias mašininio vertimo naudojimo sritis: 1) individualus vertimas; 2) atsitiktinis vertimas; 3) individualus profesionalus vertimas; 4) pramoninis profesionalus vertimas; 5) dokumentų paieškos užklausų vertimas. Mašininis vertimas gali būti skirstomas į formalųjį ir statistinį. Formalusis mašininis vertimas skirstomas į 3 tipus: tiesioginį, transformacinį, metakalbinį. Jo etapai – morfologinė analizė ir vienareikšmiškumas; sintaksinė analizė; transformavimas. Statistinis vertimas gali būti frazinis ir leksinis. Statistinis mašininis vertimas gali gana tiksliai perteikti bendrą turinį, nors ir ne viskas bus logiškai išversta. Pagrindinė tokio vertimo problema – lygiagrečių tekstynų dydis, kuris riboja leksiką ir gramatiką. Straipsnyje taip pat aptariamas Vytauto Didžiojo universiteto projektas „Internetinė informacijos vertimo priemonė“ ir mašininio vertimo kokybės vertinimas. Mašininio vertimo atveju kokybės rodikliu laikytinas procentas sakinių, įvertintas trimis ir daugiau balų.Reikšminiai žodžiai: Mašininis vertimas; Kodavimas; Metakalba; Morfologinė ir sintaksinė analizė.

ENThe article dwells on the most important landmarks in the history of machine translation (MT). When discussions about machine translations started in the middle of the 20th century, many thought that in a few years every person would carry a small device allowing people to communicate in any language. Today the view towards machine translation has become more pragmatic. For example, everyone agrees that machine translation of fiction will never be of satisfactory quality. The article discusses three key methods of machine translation: statistical, rule-based and logical. For practical purposes, often several methods of machine translation are integrated. In rule-based machine translation, the most important role is played by dictionaries and sets of rules. The article demonstrates that morphological, syntactic and semantic ambiguities are the main obstacles for creating a high-quality formal machine translation product. Statistical machine translation is based on data from parallel and monolingual corpora. While statistical machine translation is suitable for capturing the key words of a sentence, the overall quality of such translation remains low. The limited size of parallel corpora is the main obstacle of machine translation. The article also discusses evaluation criteria for assessing MT quality, which is often very problematic.

ISSN:
1392-0588; 2335-8769
Related Publications:
Permalink:
https://www.lituanistika.lt/content/8435
Updated:
2018-12-17 11:50:42
Metrics:
Views: 59    Downloads: 21
Export: