先進的音声技術研究室
MENUCLOSE
SPREDS-D1(SPeech Recognition Evaluation Data Set - Discourse type 1) ver1.2
更新履歴
- 2022/12/2 ver1.0(日本語)をリリース
- 2023/1/31 不要セグメント1件を削除し、ver1.1(日本語)としてリリース
- 2023/8/18 英語を追加し、ver1.2をリリース
概要
本データセットは、NICTが「Creative Commons Attribution 4.0 International License (CC BY 4.0)」にて提供する、講演や会議等の長時間かつ複数人数による音声を対象とした音声認識のための評価データです。対象言語は日本語、英語です。ビジネス分野を対象として、一人~三人の、架空の設定によるプレゼンを含む会議の収録音声とその書き起こしからなります。書き起こしにはNICTで規定しているタグが含まれます。詳細は、各言語のディレクトリ以下の00README.txtおよびドキュメントをご覧ください。
ダウンロード
ディレクトリについて
xz形式で圧縮しています。以下はそれぞれを解凍後のディレクトリ構造です。LABEL以下、WAVE以下のファイルの詳細は00README.txtをご覧ください。
------------------------------------------------------------------------------------------- $ver =[version number] $lang={ja,en} doc/ $lang/ 00README.txt individual/ unsegmented/ LABEL/ WAVE/ segmented/ LABEL/ WAVE/ mixed/ LABEL/ WAVE/ -------------------------------------------------------------------------------------------