先進的音声技術研究室
MENUCLOSE
NICT-Tib1: A public speech corpus of Lhasa dialect for benchmarking Tibetan language speech recognition systems developed by NICT
更新履歴
- 2024/8/27 リリース
概要
本データセットは、NICTが「Creative Commons Attribution 4.0 International License (CC BY 4.0)」にて提供する、本データセットは、少資源言語であるチベット語の収録音声およびそれらの書き起こしからなる音声コーパスで、具体的には男女(男性:8名、女性:12名、15-30歳)がチベット語のニュース原稿を読み上げている音声(計33.5時間)およびそれらの書き起こしテキストで構成される。話者においてはチベット語ラサ市方言を日常的に使用している健常な母語話者を収録したものである。音声認識の研究開発においては、その性能を評価するためのテストセット並びにモデル学習のための学習データが必須となり、本データベースはテストセット、学習データ両方としての利活用が可能である。
ダウンロード
ディレクトリについて
zip形式で圧縮しています (~3.0G)。以下はそれぞれを解凍後のディレクトリ構造です。
------------------------------------------------------------------------------------------- Tibetan/ data/ speaker-id/ speaker-session-id/ wave-files wav.scp (kaldi format) label.txt (kaldi format) README -------------------------------------------------------------------------------------------
引用
論文等で本コーパスを利用した場合は以下を引用して下さい。
------------------------------------------------------------------------------------------- @INPROCEEDINGS{nict-tib1, author={Soky, Kak and Gong, Zhuo and Li, Sheng}, booktitle={Proc. O-COCOSDA}, title={Nict-Tib1: A Public Speech Corpus Of Lhasa Dialect For Benchmarking Tibetan Language Speech Recognition Systems}, year={2022}, pages={1-5}, doi={10.1109/O-COCOSDA202257103.2022.9997917}} -------------------------------------------------------------------------------------------