SPREDS-D2 | 公開 | 先進的音声技術研究室 | ASTREC | UCRI

更新履歴

2025/8/29 ver1.1（日本語、英語、中国語）をリリース

概要

本データセットは、NICTが「Creative Commons Attribution 4.0 International License」にて提供する、リアルな（予め原稿を用意しない）対談音声データセットです。対象言語は、日本語、英語、中国語です。プロのインタビュアーが、各言語二人～三人の専門家にインタビューをしており、その収録音声と書き起こしからなります。書き起こしにはNICTで規定しているタグが含まれます。詳細は、各言語のディレクトリ以下の00README.txtおよびドキュメントをご覧ください。

ダウンロード

ver1.1--jpn/eng/zho

ディレクトリについて

xz形式で圧縮しています。以下はそれぞれを解凍後のディレクトリ構造です。LABEL以下、WAVE以下のファイルの詳細は00README.txtをご覧ください。

-------------------------------------------------------------------------------------------
$ver =[version number]
$lang={01_jpn,02_eng,03_zho}

$ver/
  00_doc/ 
  $lang/
    individual/
      unsegmented/
         LABEL/
         WAVE/
      segmented/
         LABEL/
         WAVE/
    mixed/
      LABEL/
      WAVE/
-------------------------------------------------------------------------------------------

SPREDS-D2: SPeech Recognition Evaluation Data Set - Discourse type 2 (ver1.1)

更新履歴

概要

ダウンロード

ディレクトリについて