Hierarchine fonemų struktūra grindžiamo LTDIGITS fonemų klasifikavimo tyrimas

Collection:
Mokslo publikacijos / Scientific publications
Document Type:
Knygos dalis / Part of the book
Language:
Lietuvių kalba / Lithuanian
Title:
Hierarchine fonemų struktūra grindžiamo LTDIGITS fonemų klasifikavimo tyrimas
Alternative Title:
Classification of LTDIGITS phonemes based on hierarchical phonetic structure
Keywords:
LT
Šnekos atpažinimas; Garsų klasifikavimas.
EN
Speech recognition; Sound classification.
Summary / Abstract:

LTTiesioginis fonemų klasifikavimas pakankamai gerų klasifikavimo rezultatų neužtikrina. Siūlomas supaprastintas hierarchinis lietuviškų fonemų klasifikavimo modelis, kuris grupinius fonemų požymius derina su požymiais grupėje. Fonemų sistema turi aiškiai išreikštus grupinius požymius: skardus/duslus, sprogstamasis/pučiamasis, balsis/pusbalsis. Pateikiamas struktūrinis fonemų klasifikavimo algoritmas. Toks metodas yra grindžiamas prielaida, kad fonetinių vienetų požymių erdvėje yra pakankamai informacijos užfiksuoti ir išnaudoti struktūrines kalbos signalo (būdingas tik tam tikros klasės fonemoms) savybes, kurios HMM (angl. Hidden Markov Model) modelyje išnaudojamos nepakankamai. Realizuojant hierarchine fonemų klasifikaciją net nepakeitus požymių sistemos (12 MFCC) ir klasifikavimo sprendimo taisyklių (tiesinė diskriminantinė Fišerio funkcija) galima tikėtis didesnio fonemų atpažinimo patikimumo. Eksperimento rezultatai visiškai patvirtino prielaidas. Bendras fonemų atpažinimo patikimumas padidėjo 2%. Hierarchinis klasifikavimas ypatingai sumažino klaidas balsių klasėje.

ENDirect classification of phonemes does not ensure sufficiently good results. A simplified hierarchical model for classification of Lithuanian phonemes is proposed that matches group attributes of phonemes to attributes within the group. The system of phonemes has clearly expressed group attributes: media/surd, stop/continuant, vowel/semivowel. A structured algorithm for classification of phonemes is presented. This method is based on the assumption that in the expanse of attributes of phonetic units there is sufficient information available to register and use the structural properties of the speech signal (inherent to phonemes of the appropriate class), which in HMM (Hidden Markov Model) are not availed of sufficiently. When realizing the hierarchical classification of phonemes without even changing the attribute system (12 MFCC) and classification solution rules (Fisher’s linear discriminant function), higher reliability of phonemes’’ recognition can be expected. Results of the experiment confirmed the assumptions entirely. The total reliability of phonemes’’ recognition increased by 2 %. Hierarchical classification particularly reduced mistakes in the class of vowels.

ISBN:
9955097884
Related Publications:
Lietuvių bendrinės kalbos fonetika / Antanas Pakerys. Vilnius : Enciklopedija, 2003. 241 p.
Permalink:
https://www.lituanistika.lt/content/1476
Updated:
2013-04-28 15:29:44
Metrics:
Views: 75
Export: