Lietuvių kalbos terminų automatinio nustatymo galimybės

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Lietuvių kalbos terminų automatinio nustatymo galimybės
Alternative Title:
Possibilities of automatic identification of Lithuanian terms
In the Journal:
Kalbų studijos [Studies About Languages]. 2010, Nr. 16, p. 71-78
Keywords:
LT
Terminija / Terminology.
Summary / Abstract:

LTStraipsnyje aprašoma, kokie šiuo metu prieinami elektroniniai tekstynai ar duomenų bazės, kuriuose galima rasti lietuviškus terminus. Pristatomas projektas „Švietimo ir mokslo terminų automatinis identifikavimas (ŠIMTAI)“. Taip pat apžvelgiami vieno eksperimento rezultatai, kurie pristato automatinio terminų nustatymo procesą, atskleidžia iškylančias problemas ir galimybes automatiškai nustatyti lietuvių kalbos terminus, poreikį kurti lietuvių kalbai pritaikytas automatiškai terminus nustatančias programas. Apžvelgus elektroninės terminologijos situaciją pasaulyje ir Lietuvoje, matyti, kad Lietuvoje turima nemažai elektroninių resursų, kuriuose galima rasti lietuviškų terminų, bet iki šiol neturime nė vieno žodyno, elektroninio terminyno, sudaryto remiantis tekstynais. Iš straipsnyje pristatytų bandymų automatiškai išgauti lietuvių kalbos terminus ir stabiliuosius junginius matyti, kad, norint greitai ir tiksliai išgauti tam tikros srities terminus, reikalingos programos, pritaikytos lietuvių kalbai. Kol kas nesukurta automatiškai terminus atpažįstančių programų, skirtų lietuvių kalbai. Kaip vienas iš privalumų paminėtina tai, kad lietuvių kalbai skirta automatiškai terminus nustatančia programa galima nustatyti įvairių sričių terminus; reikalingi tik skirtingų sričių tekstynai. Net ir turint automatiškai terminus išgaunančius įrankius, susiduriama su problemomis, kaip nustatyti, ar žodis yra terminas, ar žodis yra analizuojamos srities terminas, kur prasideda ir baigiasi ilgesni nei vienažodžiai terminai. Taigi terminų nustatymas negali būti visiškai automatinis procesas.Reikšminiai žodžiai: Automatinis terminų nustatymas; Tekstynas; Terminografija; Terminologija; Žodynas; Žodynas, automatinis terminų nustatymas; Automatic identification of Lithuanian terms; Automatic term setting; Corpus; Dictionary; Terminography; Terminology.

ENThe article briefly presents the terminological situation in Lithuania and all over the world. It analyses how the work of people involved in this field has been changed because of the technological and computational development, emergence of corpora, etc. The issues when it became instrumental to analyze the terms in corpora and when the first computational programs automatically determining the terms have been introduced are also taken into the account. The special emphasis in this article is put on the importance of corpora for analyzing terms, defining them and structurizing dictionaries of the terms. The stages of the terminograph how it analysis mono or bilingual corpora are described in the article as well. The paper also introduces the electronical corpora or data bases which are currently available for finding Lithuanian terms and a project which has encouraged research of the possibilities of automatic identification of educational and scientific terms. The project is called Automatic Identification of Educational and Scientific Terminology (ŠIMTAI) and is supported by the Lithuanian Research Council's National Development Program of Lituanistics (2009-2015). Additionally, the results of one experiment which supplies the process of automatic terms’ identification, which reveals uprising problems and possibilities to identify Lithuanian terms automatically, are reviewed in this paper. [text from author]

ISSN:
1648-2824; 2029-7203
Related Publications:
Permalink:
https://www.lituanistika.lt/content/26902
Updated:
2018-12-17 12:45:00
Metrics:
Views: 39    Downloads: 16
Export: