
Laskennallisen puheen tutkimusryhmä
Tutkimusryhmä
Ryhmä kehittää uusia laskennallisia koneoppimisen menetelmiä puheen, kielen ja audion älykkääseen analyysiin. Tutkimusaiheita ovat mm. puhujantunnistus, äänikonversio, kielentunnistus, biometristen hyökkäysten tunnistus, sekä linnuston äänianalyysi.
Ryhmän kuvaus
Yksi puheteknologian tärkeimpiä tutkimusalueita on puhujantunnistus, henkilön identiteetin tunnistus äänen perusteella. Kehitämme sekä uusia perusmenetelmiä (esimerkiksi piirreirroitus-, segmentointi-, luokittelu- ja datafuusioalgoritmit), että sovellamme näitä osana uusimpia puhujan- ja kielentunnistusmenetelmiä jotka nojautuvat vahvasti tilastollisen koneoppisen menetelmiin. Peruskysymys ja haastava tutkimusongelma on, kuinka tunnistaa henkilö robustisti äärimmäisen epätarkasta puhemateriaalista, joka on usein puhelinnauhoite tuntemattomassa tilassa sekä pilattuna tuntemattomalla taustamelulla tai huonekaiulla. Lisäksi ihminen itse pystyy tietoisesti muokkaamaan ääntään. Nämä haasteet vaativat älykästä kombinaatiota puheen signaalinkäsittelymalleista (sovellusalueen tietämys) yhdistettynä koneoppimisen menetelmiin, joilla opitaan mm. puhuja- ja kielispesifiset representaatioiden tuhansista tunneista annotoimatonta puhemateriaalia. Toinen tärkeä viimeaikainen tutkimussuunta, puhehyökkäysten tunnistus ja karakterisointi, liittyy erityisesti informaatioturvallisuuteen kuinka erotella ihmisen tuottama aito puhe synteettisestä tai nauhoitetusta puheesta? Valeuutisten ja nopeasti kehittyvän puhesynteesiteknologian aikana aihe on nousemassa hyvin tärkeäksi jo nykyisellä synteesiteknologialla voi tuottaa keinotekoista puhetta joka kuulostaa halutulta puhujalta. Ryhmä on ollut vetämässä tällaisten puhehyökkäysten tunnistusteknologiaa kansainvälisessä kärkijoukossa. Hiljattain päättyneessä H2020-rahoitteisessa OCTAVE-projektissa näitä menetelmiä toteutettiin pilvipalveluna pyörivään biometriseen autektikointijärjestelmään. Puhujantunnistuksen lisäksi ryhmässä tutkitaan myös kielen- ja aksentintunnistusta, sekä puhekonversiota (tietokoneella tehty imitaatio). Yksi viimeaikaisia fokuksia on myös tietokoneen ja ihmisten tekemien luokittelupäätösten vertailu ja fuusiointi em. tehtävissä.
Avainsanat
Ajanjakso
Ryhmän jäsenet - UEF
-
Abraham Woubie Zewoudie Tutkijatohtori
-
Anssi Kanervisto Nuorempi tutkija, Luonnontieteiden ja metsätieteiden tiedekunta, Tietojenkäsittelytieteen laitos
-
Rosa Gonzalez Hautamäki Tutkijatohtori, Luonnontieteiden ja metsätieteiden tiedekunta, Tietojenkäsittelytieteen laitos
-
Tomi Kinnunen Professori, Luonnontieteiden ja metsätieteiden tiedekunta, Tietojenkäsittelytieteen laitos
-
Ville Hautamäki Yliopistotutkija, Luonnontieteiden ja metsätieteiden tiedekunta, Tietojenkäsittelytieteen laitos
-
Ville Vestman Nuorempi tutkija, Luonnontieteiden ja metsätieteiden tiedekunta, Tietojenkäsittelytieteen laitos