Yleistyvä puheen huijaushyökkäysten tunnistus ja puhujantunnistus
Rahoittajat
Päärahoittaja
Suomen Akatemian tutkimusprojekti
Puhesynteesi mahdollistaa keinotekoisen puheen generoinnin tekstistä ja puhujakohtaisten ominaisuuksien joustavan muokkauksen. Keinotekoinen puhe ei kuulosta enää robottimaiselta – laadussa on jo saavutettu raja jossa korvakuulolla ei välttämättä erota ihmistä koneesta. Äänibiometriikan (puhujantunnistuksen) tarkkuus huononee nk. huijaushyökkäysten takia, ja tulevaisuudessa erilaiset puheen syväväärennökset yleistynevät. Vastatoimilla tarkoitetaan tässä automaattista “ihminen vai kone” luokittelua aaltomuodosta. SPEECHFAKES keskittyy uusiin vastatoimiin jotka voidaan yleistää datajoukosta ja hyökkäyksestä toiseen akustisesti haastavalle datalle. Tavoitteena on paitsi parantaa nykyisten vastatoimien virhesietoisuutta myös parantaa luokittelutulosten selitettävyyttä. Projektiin sisältyy kansainvälistä yhteistyötä, ml tutkijavaihtoa. Odotetut lopputulokset ovat uusia menetelmiä sekä avoimia data-aineistoja vastatoimien jatkotutkimukseen.
Ajankohtaista
-
Call for data contributors to ASVspoof 5 (deadline: October 22, 2023)
Yhteistyö
Julkaisut
6 kappaletta-
ASVspoof 2021: Towards Spoofed and Deepfake Speech Detection in the Wild
Liu, Xuechen; Wang, Xin; Sahidullah, Md; Patino, Jose; Delgado, Hector; Kinnunen, Tomi; Todisco, Massimiliano; Yamagishi, Junichi; Evans, Nicholas; Nautsch, Andreas; Lee, Kong Aik. 2023. IEEE/ACM transactions on audio, speech, and language processing. 31: 2507-2522 A1 Alkuperäisartikkeli tieteellisessä aikakauslehdessä -
How to Construct Perfect and Worse-than-Coin-Flip Spoofing Countermeasures: A Word of Warning on Shortcut Learning
Shim, Hye-jin; Gonzalez Hautamäki, Rosa; Sahidullah, Md; Kinnunen, Tomi. Teoksessa: (toim.) , 2023. Proceedings of Interspeech 2023. s. 785-789. International Speech Communication Association (ISCA) A4 Artikkeli konferenssijulkaisussa -
Multi-Dataset Co-Training with Sharpness-Aware Optimization for Audio Anti-spoofing
Shim, Hye-jin; Jung, Jee-weon; Kinnunen, Tomi. Teoksessa: (toim.) , 2023. Proceedings of Interspeech 2023. s. 3804-3808. International Speech Communication Association (ISCA) A4 Artikkeli konferenssijulkaisussa -
Speaker Verification Across Ages: Investigating Deep Speaker Embedding Sensitivity to Age Mismatch in Enrollment and Test Speech
Singh, Vishwanath Pratap; Sahidullah, Md; Kinnunen, Tomi. Teoksessa: (toim.) , 2023. Proceedings of Interspeech 2023. s. 1948-1952. International Speech Communication Association (ISCA) A4 Artikkeli konferenssijulkaisussa -
Speaker-Aware Anti-spoofing
Liu, Xuechen; Sahidullah, Md; Lee, Kong Aik; Kinnunen, Tomi. Teoksessa: (toim.) , 2023. Proceedings of Interspeech 2023. s. 2498-2502. International Speech Communication Association (ISCA) A4 Artikkeli konferenssijulkaisussa -
Towards Single Integrated Spoofing-aware Speaker Verification Embeddings
Mun, Sung Hwan; Shim, Hye-jin; Tak, Hemlata; Wang, Xin; Liu, Xuechen; Sahidullah, Md; Jeong, Myeonghun; Han, Min Hyun; Todisco, Massimiliano; Lee, Kong Aik; Yamagishi, Junichi; Evans, Nicholas; Kinnunen, Tomi; Kim, Nam Soo; Jung, Jee-weon. Teoksessa: (toim.) , 2023. Proceedings of Interspeech 2023. s. 3989-3993. International Speech Communication Association (ISCA) A4 Artikkeli konferenssijulkaisussa