先進的音声技術研究室
MENUCLOSE
SPREDS-U1: SPeech Recognition Evaluation Data Set - Utterance type 1 (ver1.0)
更新履歴
- 2023/7/4 ver1.0をリリース
概要
本データセットは、NICTが「クリエイティブコモンズ国際規格CC BY 4.0」にて提供する多言語音声認識のための評価データです。対象言語は、SPREDS2として公開していた日英中韓等12言語、SPREDS3として公開していたフィリピン語等4言語に、新たに中国語の台湾方言、アラビア語、ドイツ語、イタリア語、ヒンディー語、ウクライナ語を加えた21言語22地域です。ドメインや人数、収録環境等、ほぼ同条件で収録された音声とその書き起こしからなり、SPREDS2とSPREDS3では異なっていた話者IDの付与規則などのフォーマットを統一化しました。音声ファイルには、低周波ノイズを除去するため、一律ハイパスフィルタをかけています。書き起こしは特にタグを加えていない、素起こしです。詳細は、00_DOC以下のREADME.txtおよび各言語のディレクトリ以下の00README.txtをご覧ください。
21言語22地域セット
ディレクトリについて
xz形式で圧縮しています。以下はそれぞれを解凍後のディレクトリ構造です。
------------------------------------------------------------------------------------------- $ver ={ver1.0} $lang={01_jpn,02_eng,03_zho,04_kor,05_tha,06_vie,07_ind,08_mya,09_spa,10_fra,11_por_BRA,12_ara,13_rus,14_fil,15_khm,16_nep,17_mon,18_zho_TWN,19_ita,20_deu,21_hin,22_ukr} $speaker_id=[see 00README.txt] $ver/ 00_DOC/ GCP_DialectCode_v1.2.3.xlsx README.txt $lang/ 00README.txt LABEL/ SPREDS-U1.$ver.label WAVE/ $speaker_id/ *.wav -------------------------------------------------------------------------------------------