Laskennallisen puheen tutkimusryhmä profiilikuva

Laskennallisen puheen tutkimusryhmä

Tutkimusryhmä
08.10.2017 -

Ryhmän kuvaus

Yksi puheteknologian tärkeimpiä tutkimusalueita on puhujantunnistus, henkilön identiteetin tunnistus äänen perusteella. Kehitämme sekä uusia perusmenetelmiä (esimerkiksi piirreirroitus-, segmentointi-, luokittelu- ja datafuusioalgoritmit), että sovellamme näitä osana uusimpia puhujan- ja kielentunnistusmenetelmiä jotka nojautuvat vahvasti tilastollisen koneoppisen menetelmiin. Peruskysymys ja haastava tutkimusongelma on, kuinka tunnistaa henkilö robustisti äärimmäisen epätarkasta puhemateriaalista, joka on usein puhelinnauhoite tuntemattomassa tilassa sekä pilattuna tuntemattomalla taustamelulla tai huonekaiulla. Lisäksi ihminen itse pystyy tietoisesti muokkaamaan ääntään. Nämä haasteet vaativat älykästä kombinaatiota puheen signaalinkäsittelymalleista (sovellusalueen tietämys) yhdistettynä koneoppimisen menetelmiin, joilla opitaan mm. puhuja- ja kielispesifiset representaatioiden tuhansista tunneista annotoimatonta puhemateriaalia. Toinen tärkeä viimeaikainen tutkimussuunta, puhehyökkäysten tunnistus ja karakterisointi, liittyy erityisesti informaatioturvallisuuteen  kuinka erotella ihmisen tuottama aito puhe synteettisestä tai nauhoitetusta puheesta? Valeuutisten ja nopeasti kehittyvän puhesynteesiteknologian aikana aihe on nousemassa hyvin tärkeäksi  jo nykyisellä synteesiteknologialla voi tuottaa keinotekoista puhetta joka kuulostaa halutulta puhujalta. Ryhmä on ollut vetämässä tällaisten puhehyökkäysten tunnistusteknologiaa kansainvälisessä kärkijoukossa. Hiljattain päättyneessä H2020-rahoitteisessa OCTAVE-projektissa näitä menetelmiä toteutettiin pilvipalveluna pyörivään biometriseen autektikointijärjestelmään. Puhujantunnistuksen lisäksi ryhmässä tutkitaan myös kielen- ja aksentintunnistusta, sekä puhekonversiota (tietokoneella tehty imitaatio). Yksi viimeaikaisia fokuksia on myös tietokoneen ja ihmisten tekemien luokittelupäätösten vertailu ja fuusiointi em. tehtävissä.

Avainsanat