
TOMI KINNUNEN
Apulaisprofessori
Tutkimukseni keskittyy puheteknologiaan, erityisesti puhujan- ja kielentunnistukseen, puhebiometristen järjestelmien haavoittuvuuksiin/turvallisuuteen sekä äänikonversioon. Johdan UEF:in laskennalliseen puheen tutkimusryhmää Itä-Suomen yliopiston tietojenkäsittelytieteen laitoksella jossa pyrimme lähestymään em. ongelmia mm. koneoppimisen ja signaalinkäsittelyn keinoin. Ryhmäni osallistuu säännöllisesti puheteknologian ja koneoppimisen kansainvälisiin teknologiaevaluointeihin (ja on ollut myös koordinoimassa niitä). Mikäli olet kiinnostunut yhteistyöstä johon liittyy tavalla tai toisella puhetta (tai muuta audiota), ota yhteyttä. Ks. lisätietoja englanninkielisessä profiilistani sekä verkkosivuiltani http://cs.joensuu.fi/pages/tkinnu/webpage/
Tutkimusaiheet:
- Puhujan- ja kielentunnistus (ml. automaattiset menetelmät ja kuulonvarainen tunnistus)
- Äänibiometriikan huijaushyökkäykset (spoofing attack) ja niiden vastatoimet
- Äänikonversio
- Puheteknologian soveltaminen muihin akustisiin signaaleihin
Yhteystiedot
Organisaatio
Luonnontieteiden ja metsätieteiden tiedekunta, Tietojenkäsittelytieteen laitos
Tutkimusryhmät
-
LinkedIn LinkedIn profile
-
Research gate Researchgate profile
-
Orcid ORCID profile
-
Linkki Verkkosivuni
Julkaisut
-
An Initial Investigation on Optimizing Tandem Speaker Verification and Countermeasure Systems Using Reinforcement Learning. Kanervisto, Anssi; Hautamäki, Ville; Kinnunen, Tomi; Yamagishi, Junichi / Proceedings of Odyssey 2020: The Speaker and Language Recognition Workshop. 2020. 2020
-
Kinnunen, Tomi; Delgado, Hector; Evans, Nicholas; Lee, Kong Aik; Vestman, Ville; Nautsch, Andreas; Todisco, Massimiliano; Wang, Xin; Sahidullah, Md; Yamagishi, Junichi; Reynolds, Douglas A. 2020. Tandem Assessment of Spoofing Countermeasures and Automatic Speaker Verification: Fundamentals IEEE/ACM transactions on audio, speech, and language processing 28: 2195-2210. 2020
-
Neural i-vectors. Vestman, Ville; Lee, Kong Aik; Kinnunen, Tomi / Proceedings of Odyssey 2020: The Speaker and Language Recognition Workshop. 2020. 2020
-
Subband Modeling for Spoofing Detection in Automatic Speaker Verification. Chettri, Bhusan; Kinnunen, Tomi; Benetos, Emmanouil / Proceedings of Odyssey 2020: The Speaker and Language Recognition Workshop. 2020. 2020
-
Towards Controlling False Alarm - Miss Trade-Off in Perceptual Speaker Comparison via Non-Neutral Listening Task Framing. Gonzalez Hautamäki, Rosa; Kinnunen, Tomi / 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU): Proceedings. 2020. 2020
-
Wang, Xin; Yamagishi, Junichi; Todisco, Massimiliano; Delgado, Héctor; Nautsch, Andreas; Evans, Nicholas; Sahidullah, Md; Vestman, Ville; Kinnunen, Tomi; Lee, Kong Aik; Juvela, Lauri; Alku, Paavo; Peng, Yu-Huai; Hwang, Hsin-Te; Tsao, Yu; Wang, Hsin-Min; Maguer, Sébastien Le; Becker, Markus; et al.. 2020. ASVspoof 2019: A large-scale public database of synthetized, converted and replayed speech Computer speech and language 64: 101114. 2020
-
Why Did the x-Vector System Miss a Target Speaker? Impact of Acoustic Mismatch Upon Target Score on VoxCeleb Data. Gonzalez Hautamäki, Rosa; Kinnunen, Tomi / Proceedings of Interspeech 2020. 2020. 2020
-
Chettri, Bhusan; Kinnunen, Tomi; Benetos, Emmanouil. 2020. Deep generative variational autoencoding for replay spoof detection in automatic speaker verification Computer speech and language 63: 101092. 2020
-
Kato, Akihiro; Kinnunen, Tomi H. 2019. Statistical Regression Models for Noise Robust F0 Estimation Using Recurrent Deep Neural Networks IEEE/ACM transactions on audio, speech, and language processing 27 12: 2336-2349. 2019
-
Vestman, Ville; Kinnunen, Tomi; González Hautamäki, Rosa; Sahidullah, Md. 2019. Voice Mimicry Attacks Assisted by Automatic Speaker Verification Computer speech and language 2020; 59: 36-54. 2019