Tarkenna hakuasi

Laskennallisen puheen tutkimusryhmä profiilikuva

Laskennallisen puheen tutkimusryhmä

Tutkimusryhmä
08.10.2017 -
Tietojenkäsittelytieteen laitos, Luonnontieteiden, metsätieteiden ja tekniikan tiedekunta

Yksi puheteknologian tärkeimpiä tutkimusalueita on puhujantunnistus, henkilön identiteetin tunnistus äänen perusteella. Kehitämme sekä uusia perusmenetelmiä (esimerkiksi piirreirroitus-, segmentointi-, luokittelu- ja datafuusioalgoritmit), että sovellamme näitä osana uusimpia puhujan- ja kielentunnistusmenetelmiä jotka nojautuvat vahvasti tilastollisen koneoppisen menetelmiin. Peruskysymys ja haastava tutkimusongelma on, kuinka tunnistaa henkilö tarkasti epätarkasta puhemateriaalista, joka on usein puhelinnauhoite tuntemattomassa tilassa (tai vaikkapa verkkosivuilta ladattava näyte), pilattuna taustahälyllä, huonekaiulla tai muilla häiriötekijöillä. Lisäksi ihminen itse pystyy tietoisesti muokkaamaan ääntään. Nämä haasteet vaativat älykästä kombinaatiota puheen signaalinkäsittelymalleista (sovellusalueen tietämys) yhdistettynä koneoppimisen menetelmiin, joilla opitaan mm. puhuja- ja kielispesifiset representaatioiden tuhansista tunneista annotoimatonta puhemateriaalia. Toinen tärkeä viimeaikainen tutkimussuunta, puhehyökkäysten tunnistus ja karakterisointi, liittyy erityisesti informaatioturvallisuuteen – kuinka erotella ihmisen tuottama aito puhe synteettisestä tai nauhoitetusta puheesta? Valeuutisten ja nopeasti kehittyvän äänikloonausteknologian aikana aihe on nousemassa hyvin tärkeäksi. Jo nykyisellä synteesiteknologialla voi tuottaa keinotekoista puhetta joka kuulostaa halutulta puhujalta. Ryhmä on ollut vetämässä tällaisten puhehyökkäysten tunnistusteknologiaa kansainvälisessä kärkijoukossa (ks. www.asvspoof.org).

Lisätietoja ryhmästä: https://sites.uef.fi/speech/

Avainsanat