BDAR

Jūsų asmens duomenų valdymas.

Siekdami užtikrinti geriausią Jūsų naršymo patirtį, šioje svetainėje naudojame slapukus (angl. cookies). Naršydami toliau patvirtinsite savo sutikimą naudoti slapukus. Savo sutikimą bet kada galėsite atšaukti pakeisdami interneto naršyklės nustatymus ir ištrindami įrašytus slapukus.

Slapukų politika Privatumo politika

 


Spausdinti

Rezultatai ir statistika

Projekto 09.3.3-LMT-K-712-02-0093 "Priebalsių analizė ir modeliavimas naudojant jungtinį adityvinės sintezės ir šaltinio-filtro modelio metodą" įgyvendinimo metu sukurta produkcija

Vykdytojas Vilniaus universitetas
Produkto sritis Švietimas ir mokslas
Produkto rūšys Tyrimai, studijos

Projekto vykdytojo teigimu, šnekos signalas perneša informaciją ne tik apie tariamas fonemas ir jų junginius, prozodiją, bet ir asmens individualybę nusakančius aspektus, tokius kaip pašnekovo emocinė būsena, amžius, savijauta. Visos išvardytos komponentės yra perduodamos vienmačiu signalu. Projekto tikslas - sukurti lietuviškos šnekos priebalsių fonemų dinaminius modelius, kurie generuotų natūraliai skambančius garsus. Norint atlikti fonemų signalų modeliavimą, yra svarbu įvertinti parametrus, apibūdinančius tariamą garsą ir kalbančiojo balso akustines savybes. Dažniausiai požymiams klasifikuoti yra taikomi gerai žinomi klasifikavimo algoritmai, tokie kai paslėptieji Markovo modeliai, artimųjų kaimynų, atraminių vektorių mašinos, dirbtinių neuronų tinklai, bei šių algoritmų kombinacijos. Projekto įgyvendinimo metu į parametrizavimo uždavinį pažvelgta iš naujos perspektyvos. Požymių rinkinio klasifikavimo problemoms spręsti, be klasikinių algoritmų, naudoti giliojo apmokymo neuronų tinklai. Sintezuotos šnekos signalas buvo sukuriamas naudojant adityvinę sintezę ir akustinį modelį. Tuo tikslu nagrinėti skirtingis žadinimo signalai, tokie kaip kvaziperiodiniai impulsai, triukšmas, arba jų kombinacijos. Fonemų matematiniai modeliai leido modeliuoti šnekos signalus. Šie modeliai gali būti pritaikyti daugybei uždavinių spręsti, pavyzdžiui, sprendžiant šnekos sintezės bei atpažinimo uždavinius, atliekant lingvistinius tyrimus, diagnozuojant ar gydant kalbos sutrikimus, mokantis užsienio kalbų ar taisyklingo žodžių tarimo.

Atliktų tyrimų metu gauti rezultatai viešinami sukurtoje mokslinėje produkcijoje.

Mokslo straipsniai:

  1. G. Korvel, B. Kostek,O.  Kurasova. Comparative Analysis of Various Transformation Techniques for Voiceless Consonants Modeling. (International  Journal of Computers Communications  & control , ISSN 1841-9836, 13(5), 853-864, October 2018.).
  2. G. Korvel, O  Kurasova, B. Kostek. Comparison of Lithuanian and Polish Consonant Phonemes Based on Acoustic Analysis – Preliminary Results. (Archives of Acoustics, 44, 4, pp. 693–707, 2019).
  3. G. Korvel, K. Kąkol, O. Kurasova, B. Kostek. Evaluation of Lombard Speech Models in the Context of Speech in Noise Enhancement. (IEEE Access (Volume: 8), Electronic ISSN: 2169-3536, Page(s): 155156 - 155170).
  4. G. Korvel, O. Kurasova, B. Kostek, (2019). An Attempt to Create Speech Synthesis Model That Retains Lombard Effect Characteristics. (16th International Conference on Signal Processing and Multimedia Applications. 280-289. 10.5220/0007854302800289).
  5. G. Korvel, O. Kurasova, B. Kostek. Comparative Analysis of Spectral and Cepstral Feature Extraction Techniques for Phoneme Modelling. (International Conference on Multimedia and Network Information System. MISSI 2018: Multimedia and Network Information Systems pp 480-489).

Moksliniai pranešimai:

  1. G. Korvel, G. Tamulevičius, P. Treigys, Bernatavičienė J., Kostek B. ,,Investigating Feature Spaces for Isolated Word Recognition" (The 10th International Workshop on Data Analysis methods for Software Systems, 29 November - 1 December 2018, Druskininkai, Lithuania).
  2. G. Korvel, O. Kurasova, B. Kostek. Comparative Analysis of Spectral and Cepstral Featurev Extraction techniques for phoneme modelling.  (The 11th edition of International Conference on Multimedia & Network Information Systems, 12-14 September Wroclaw, Poland).
  3. G. Korvel, K. Kąkol,  B. Kostek. Evaluation of Lombard Speech Models in the Context of Speech in Noise Enhancemen. (The 11th International Workshop Data Analysis Methods for Software Systems, 28-30 November 2019, Druskininkai, Lithuania).
  4. G. Korvel, O. Kurasova, B. Kostek. An Attempt to Create Speech Synthesis Model That Retains Lombard Effect Characteristics. (SIGMAP2019 16th International Conference on Signal Processing and Multimedia Applications, 26-28 July 2019, Prague, Czech Republic).