Automatizuotas sakinio ribų ir sutrumpinimų žymėjimas lietuviškame tekste

RinkinysMokslo publikacijos / Scientific publications
Publikacijos rūšisKnygos dalis / Part of the book
KalbaLietuvių kalba / Lithuanian
AntraštėAutomatizuotas sakinio ribų ir sutrumpinimų žymėjimas lietuviškame tekste
Kita antraštėComputer-Assisted Marking of Sentence Limits and Abbreviations in Lithuanian Text
Autoriai
KnygojeInformacinės technologijos : konferencijos pranešimų medžiaga: 2005 m. sausio mėn. 26-27 d. T. 1 . 2005, p. 299-303
Reikšminiai žodžiai
LTTekstynai; Sutrumpinimai; Sakinio ribos; Žymėjimas; Algoritmai; Paieška
Santrauka / Anotacija

LTStraipsnyje pateikiamas sutrumpinimų ir sakinio ribų lietuviškame tekste žymėjimo algoritmas ir jo tyrimas. Siūlomas algoritmas naudoja specialiai sukurtus sakinio ribų ir sutrumpinimų paieškos šablonus; sutrumpinimai taip pat kaupiami specializuotame resursų faile, o nauja informacija vėliau naudojama paieškos šablonuose. Algoritmas gali veikti vienu iš dviejų automatizacijos režimų, nuo kurio priklauso kaip dažnai algoritmas abejotinais atvejais kreipiasi į vartotoją. Siūlomi metodai, kurie yra taikomi sutrumpinimų žymėjimui yra adaptyvūs – jų efektyvumas nuolat auga, augant apdorotų tekstų kiekiui. Gautas aukštas efektyvumas užtikrina tolimesnes metodų taikymo galimybes įvairioms sritims. [Iš leidinio]

ENThe article presents the algorithm of marking abbreviations and sentence limits in Lithuanian text as well as its analysis. The algorithm suggested uses specially designed sentence limits and abbreviation search samples; abbreviations are also stored in a specialized resource file and new information is later used in search samples. The algorithm can operate in one of two automation modes, which determine how frequently the algorithm addresses the user in doubtful cases. The methods suggested for abbreviation marking are adaptive, i.e. their effectiveness constantly increases as the amount of processed texts grows. The achieved high effectiveness ensures further possibilities of method application in various fields.

ISBN9955097884
Mokslo sritisKalbotyra / Linguistics
Nuoroda į įrašą https://www.lituanistika.lt/content/1606
Atnaujinta2013-04-28 15:31:16
Metrika Peržiūros: 6