多言語音声認識評価用データセット2
(SPREDS2: SPeech Recognition Evaluation Data Set 2)

概要: 本データセットは、多言語音声認識のための評価データです。 ドメインや人数、収録環境等、ほぼ同条件で収録された音声とその書き起こしからなります。 書き起こしは特にタグを加えていない、素起こしです。 詳細は、各言語のディレクトリ以下の00README.txtをご覧ください。

ディレクトリ構造: xz形式で圧縮しています。以下はそれぞれを解凍後のディレクトリ構造です。
・一式(10lang_all)
$ver/
 $lang/
  LABEL/
   SPREDS2.$ver.$lang.label
   SPREDS2.$ver.$lang.info
  WAVE/
   *.wav
  00README.txt
 doc/
  GCP_DialectCode_v1.0.3.xlsx

・言語ごと
$lang/
 LABEL/
  SPREDS2.$ver.$lang.label
  SPREDS2.$ver.$lang.info
 WAVE/
  *.wav
 00README.txt
 ※DialectCodeは、別途DLください。

$ver =[version number]
$lang={ja,en,zh,ko,th,vi,id,my,es,fr}

ライセンス(修正版BSD) | ダウンロード