
MENUCLOSE
SPREDS3: SPeech Recognition Evaluation Data Set 3 (ver1.0)
更新履歴
- 2020/12/22 ver1.0をリリース。
概要
本データセットは、NICTが「修正BSDライセンス」にて提供する多言語音声認識のための評価データです。対象言語は、フィリピン語、ネパール語、クメール語、モンゴル語です。ドメインや人数、収録環境等、ほぼ同条件で収録された音声とその書き起こしからなります。書き起こしは特にタグを加えていない、素起こしです。詳細は、各言語のディレクトリ以下の00README.txtをご覧ください。
4言語セット
ディレクトリについて
xz形式で圧縮しています。以下はそれぞれを解凍後のディレクトリ構造です。
-------------------------------------------------------------------------------------------
$ver =[version number]
$lang={fl,ne.km.mn}
>>>4言語セット
$ver/
$lang/
LABEL/
SPREDS3.$lang.$ver.label
SPREDS3.$lang.$ver.info
WAVE/
*.wav
00README.txt
doc/
DialectCode_v1.1.1.xlsx
-------------------------------------------------------------------------------------------