Garsynas LIEPA

Lietuvių šnekos garsynas LIEPA – fonetiškai reprezentatyvi lietuvių šnekos duomenų bazė, pritaikyta šnekos technologijų moksliniams tyrimams ir konstravimo darbams, elektroninių paslaugų teikimui.
Garsyną sudaro šnekos atpažinimo paslaugų tikslais parengta 100 val. ir šnekos sintezavimo tikslais parengta 13 val. trukmės garsyno dalys. Garsyno fonemų sistema – MBROLA. Garso įrašų charakteristikos: formatas – .wav, diskretizavimo dažnis – 22 kHz,  kvantavimas – 16 bitų, kanalų skaičius – 1.
100 val. trukmės garsyno dalį sudaro garso įrašai, juos atitinkančios anotacijos (formatas – .txt) ir transkribuotų garsyno žodžių žodynas (formatas – .xls). Diktorių skaičius – 376 (248 mot. ir 128 vyr., 83 proc. diktorių amžius 15-22 m.). Garso įrašai: žodžių, frazių, sakinių ir jų dalių.
13 val. trukmės garsyno dalį sudaro garso įrašai ir juos atitinkančios anotacijos (formatas – .TextGrid). Diktorių skaičius – 4 (2 mot. ir 2 vyr.). Garso įrašai: 5000 sakinių.
Dėl didelės apimties, garsynas tiesioginiam atsisiuntimui nėra pateikiamas. Susidomėjusius garsynu, prašome kreiptis į garsyno kūrėjus adresu gediminas.navickas[eta]mif.vu.lt
Lietuvių šnekos garsynas LIEPA platinamas pagal CC BY licenciją, ją galite rasti čia >>>
Panaudojus garsyną kitų produktų sukūrimui, prašome paminėti savo produkto aprašyme, kad jis buvo sukurtas Vilniaus universitete, vykdant projektą „Lietuvių šneka valdomos paslaugos – LIEPA“.