
MENUCLOSE
SPREDS-D2: SPeech Recognition Evaluation Data Set - Discourse type 2 (ver1.1)
更新履歴
- 2025/8/29 ver1.1(日本語、英語、中国語)をリリース
概要
本データセットは、NICTが「Creative Commons Attribution 4.0 International License」にて提供する、リアルな(予め原稿を用意しない)対談音声データセットです。対象言語は、日本語、英語、中国語です。プロのインタビュアーが、各言語二人~三人の専門家にインタビューをしており、その収録音声と書き起こしからなります。書き起こしにはNICTで規定しているタグが含まれます。詳細は、各言語のディレクトリ以下の00README.txtおよびドキュメントをご覧ください。
ダウンロード
ディレクトリについて
xz形式で圧縮しています。以下はそれぞれを解凍後のディレクトリ構造です。LABEL以下、WAVE以下のファイルの詳細は00README.txtをご覧ください。
------------------------------------------------------------------------------------------- $ver =[version number] $lang={01_jpn,02_eng,03_zho} $ver/ 00_doc/ $lang/ individual/ unsegmented/ LABEL/ WAVE/ segmented/ LABEL/ WAVE/ mixed/ LABEL/ WAVE/ -------------------------------------------------------------------------------------------