本文へ移動

先進的音声技術研究室

ビジネスや国際会議における実用的な音声認識技術および
音声合成技術の研究開発を進めています。

ビジネスや国際会議における実用的な音声認識技術および音声合成技術の研究開発を進めています。

2020年東京オリンピック・パラリンピック競技大会での社会実装に向けて、10言語(日、英、中、韓、タイ、ベトナム、インドネシア、ミャンマー、スペイン、フランスの各言語)の実用的な音声認識技術を実現します。そのための研究開発として、①日英中韓の4言語に関して2000時間程度の音声コーパス、その他の言語に関しては500時間程度の音声コーパスの構築、②言語モデルの多言語化・多分野化、③音声認識工ンジンの高速化・高精度化、を行います。音声合成技術の研究開発に関しては、前記10言語の実用的な音声合成システムを実現します。また、2020年以降の世界を見据えた研究開発として、④世界のあらゆる音声コンテンツをテキスト化する技術の実現を目指して、公共空間等雑音・残響のある環境下で言語の異なる複数人が発声した音声を認識する技術、及び⑤多言語の混合言語音声対話技術の研究開発、を行います。