Laskennallisen puheen tutkimusryhmä

Tarkenna hakuasi

Tutkimusryhmä

08.10.2017 -

Tietojenkäsittelytieteen laitos, Luonnontieteiden, metsätieteiden ja tekniikan tiedekunta

Tiedot

Yksi puheteknologian tärkeimpiä tutkimusalueita on puhujantunnistus, henkilön identiteetin tunnistus äänen perusteella. Kehitämme sekä uusia perusmenetelmiä (esimerkiksi piirreirroitus-, segmentointi-, luokittelu- ja datafuusioalgoritmit), että sovellamme näitä osana uusimpia puhujan- ja kielentunnistusmenetelmiä jotka nojautuvat vahvasti tilastollisen koneoppisen menetelmiin. Peruskysymys ja haastava tutkimusongelma on, kuinka tunnistaa henkilö tarkasti epätarkasta puhemateriaalista, joka on usein puhelinnauhoite tuntemattomassa tilassa (tai vaikkapa verkkosivuilta ladattava näyte), pilattuna taustahälyllä, huonekaiulla tai muilla häiriötekijöillä. Lisäksi ihminen itse pystyy tietoisesti muokkaamaan ääntään. Nämä haasteet vaativat älykästä kombinaatiota puheen signaalinkäsittelymalleista (sovellusalueen tietämys) yhdistettynä koneoppimisen menetelmiin, joilla opitaan mm. puhuja- ja kielispesifiset representaatioiden tuhansista tunneista annotoimatonta puhemateriaalia. Toinen tärkeä viimeaikainen tutkimussuunta, puhehyökkäysten tunnistus ja karakterisointi, liittyy erityisesti informaatioturvallisuuteen – kuinka erotella ihmisen tuottama aito puhe synteettisestä tai nauhoitetusta puheesta? Valeuutisten ja nopeasti kehittyvän äänikloonausteknologian aikana aihe on nousemassa hyvin tärkeäksi. Jo nykyisellä synteesiteknologialla voi tuottaa keinotekoista puhetta joka kuulostaa halutulta puhujalta. Ryhmä on ollut vetämässä tällaisten puhehyökkäysten tunnistusteknologiaa kansainvälisessä kärkijoukossa (ks. www.asvspoof.org).

Lisätietoja ryhmästä: https://sites.uef.fi/speech/

Avainsanat

automaattinen kaiuttimien varmennus digitaaalinen signaalinkäsittely faktorianalyysimallit generatiivinen mallintaminen havainnollinen arviointi huijauksenesto jakaminen osiin klusterointi linnuston äänianalyysi luokittelu ominaisuuksien erottaminen puheteknologia puhutun kielen tunnistaminen syväoppiminen tietofuusio äänen muuntaminen äänibiometriset tiedot ääniluokitus