Kalbinė įranga ir jos galimybės

Direct Link:
Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Straipsnis / Article
Language:
Lietuvių kalba / Lithuanian
Title:
Kalbinė įranga ir jos galimybės
Alternative Title:
Linguistic software in corpus linguistics
In the Journal:
Darbai ir dienos [Deeds and Days]. 2000, t. 24, p. 275-285. Tekstynų lingvistika
Keywords:
LT
Dažninis sąrašas; Kalbinė įranga; Kompiuterinė lingvistika; Konkordancai; Lingvistinių duomenų apdorojimas kompiuteriu; Tekstynas; Tekstynų lingvistika.
EN
Computational linguistics; Concordancers; Corpora; Corpus linguistics; Frequency list; Linguistic data processing; Linguistic software.
Summary / Abstract:

LTStraipsnyje trumpai apibūdinama reikšmingiausia kalbinė programinė įranga, detaliau gilinamasi į dažninių sąrašų generatorių ir konkordavimo programas. Kompiuterinės programos grupuojamos pagal atliekamas funkcijas ir paskirtį. Konverteriai leidžia konvertuoti tekstą į norimą formatą. Dažninių sąrašų generatoriai skaičiuoja dažnines žodžių charakteristikas. Sudarytuose sąrašuose nurodomas kiekvienos žodžio formos pasirodymo dažnis tekste. Konkordavimo programos yra teksto arba tekstyno paieškos sistema, leidžianti rasti reikalingą informaciją apie atskirus teksto elementus ir pateikti ją patogia forma – konkordansu. Sintaksinės analizės programos yra sudėtingesnė programų rūšis, leidžianti analizuoti sakinių sintaksę. Paprastai jos identifikuoja žodžius sakinyje, nustato jų sintaksinį priklausymą, sugrupuoja į aukštesnio lygio vienetus ir atitinkamai juos pavadina. Klaidų tikrintuvai randa klaidas elektroniniame tekste ir padeda jas ištaisyti. Skiemenuokliai automatiškai perkelia žodžius į kitą eilutę pagal žodžių kėlimo taisykles. Lemuokliai įvairias vieno žodžio formas sujungia į vieną antraštinę – lemą. Morfologiniai analizatoriai automatiškai nustato analizuojamo žodžio gramatines charakteristikas. Anotatoriai prie žodžių ar kitų tekstinių vienetų prirašo tam tikras pažymas, aiškinančias jų bruožus. Paralelinimo programos skirtos vertimo ir originalo kalbų tekstams lygiagretinti. Leksinės duomenų bazės – svarbus įrankis, leidžiantis analizuoti didžiulį leksinės informacijos kiekį. Mašininio vertimo sistemos skirtos automatiškai versti tekstams iš vienos kalbos į kitą.

ENThe article deals with linguistic software (lingware) which is used in corpus linguistics. The types of the lingware are enumerated as well as their functions, capabilities, and availability for the Lithuanian language research. Most of the software tools such as converters, word list generators, concordance programs, lemmatizers, morphological analysers are extensively used and developed at the Centre of Computational Linguistics at Vytautas Magnus University in Kaunas. The article also touches upon the problem of universality of lingware. A special attention is paid to the central software in corpus linguistics, that is concordanc e s and word list generators. The article shows that these computer programs, if used properly would enable a linguist to better cope with large amounts of data that is taken from multi-million word electronic corpora. [text from author]

ISSN:
1392-0588; 2335-8769
Related Publications:
Permalink:
https://www.lituanistika.lt/content/37793
Updated:
2018-12-17 10:47:19
Metrics:
Views: 84    Downloads: 14
Export: