Dr. Masakiyo Fujimoto

Publications

Book chapters

Xugang Lu, Sheng Li, and Masakiyo Fujimoto, ``Automatic speech recognition,'' in ``Speech-to-Speech Translation,'' Springer, chapter 2, pp. 21-38, 2020.
Yasuaki Iwata, Tomohiro Nakatani, Takuya Yoshioka, Masakiyo Fujimoto, and Hirofumi Saito, ``Maximum a posteriori spectral estimation with source log-spectral priors for multichannel speech enhancement,'' in ``Speech and Audio Processing for Coding, Enhancement and Recognition,'' Springer, chapter 3.1, pp. 281-317, 2015.
Masakiyo Fujimoto, ``Integration of statistical model-based voice activity detection and noise suppression for noise robust speech recognition,'' in ``Advances in Robust Speech Recognition Technology,'' Bentham Publishing Services, chapter 1, pp. 1-12, March 2011.
Masakiyo Fujimoto, Kazuya Takeda, and Satoshi Nakamura, ``An evaluation database for in-car speech recognition and its common evaluation framework,'' in ``Computer Processing of Asian Spoken Languages,'' Consideration Books, c/o The Americas Group, chapter 4.4.2, pp. 139-142, March 2010.

[Page top]

Journal articles

Tomoko Kawase, Kenta Niwa, Espi, Masakiyo Fujimoto, Kazunori Kobayashi, Shoko Araki, and Tomohiro Nakatani ``Integration of spatial cue-based noise reduction and speech model-mased source restoration for real time speech enhancement,'' IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, Vol. E100-A, No. 5, pp. 1127-1136, May 2017.
Miquel Espi, Masakiyo Fujimoto, Keisuke Kinoshita, and Tomohiro Nakatani, ``Exploiting spectro-temporal locality in deep learning based acoustic event detection,'' EURASIP Journal on Audio, Speech, and Music Processing, vol. 2015, no. 26, Sept. 2015.
Miquel Espi, Masakiyo Fujimoto, and Tomohiro Nakatani, ``Acoustic event detection in speech overlapping scenarios based on high resolution spectral input and deep learning,'' IEICE Transactions on Information and Systems, Vol. E98-D, No. 10, pp. 1799-1807, Oct. 2015.
Marc Delcroix, Takuya Yoshioka, Atsunori Ogawa, Yotaro Kubo, Masakiyo Fujimoto, Nobutaka Ito, Keisuke Kinoshita, Miquel Espi, Shoko Araki, Takaaki Hori, and Tomohiro Nakatani, ``Strategies for distant speech recognition in reverberant environments,'' EURASIP Journal on Advances in Signal Processing, vol. 2015, no. 60, July 2015.
Tomohiro Nakatani, Shoko Araki, Takuya Yoshioka, Marc Delcroix, and Masakiyo Fujimoto, ``Dominance based integration of spatial and spectral features for speech enhancement,'' IEEE Transactions on Audio, Speech and Language Processing, vol. 21, no. 12, pp. 2516-2531, Dec. 2013.
Marc Delcroix, Keisuke Kinoshita, Tomohiro Nakatani, Shoko Araki, Atsunori Ogawa, Takaaki Hori, Shinji Watanabe, Masakiyo Fujimoto, Takuya Yoshioka, Takanobu Oba, Yotaro Kubo, Mehrez Souden, Seong-Jun Hahm, and Atsushi Nakamura, ``Speech recognition in living rooms: Integrated speech enhancement and recognition system based on spatial, spectral and temporal modeling of sounds,'' Computer Speech and Language, vol. 27, pp. 851-873, May 2013.
Seong-Jun Hahm, Shinji Watanabe, Atsunori Ogawa, Masakiyo Fujimoto, Takaaki Hori, and Atsushi Nakamura, ``Proir-shared feature and model space speaker adaptation by consistently employing MAP estimation,'' Speech communication, vol. 55, No. 3, pp. 415-431, Mar. 2013.
Masakiyo Fujimoto, Shinji Watanabe, and Tomohiro Nakatani, ``Frame-wise model re-estimation method based on Gaussian pruning with weight normalization for noise robust voice activity detection,'' Speech communication, vol. 54, no. 2, pp. 229-244, Feb. 2012.
Takaaki Hori, Shoko Araki, Takuya Yoshioka, Masakiyo Fujimoto, Shinji Watanabe, Takanobu Oba, Atsunori Ogawa, Kazuhiro Otsuka, Dan Mikami, Keisuke Kinoshita, Tomohiro Nakatani, Atsushi Nakamura, and Junji Yamato, ``Low-latency real-time meeting recognition and understanding using distant microphones and omni-directional camera,'' IEEE Transactions on Audio, Speech and Language Processing, vol. 20, no. 2, pp. 499-513, Feb. 2012.
Kentaro Ishizuka, Tomohiro Nakatani, Masakiyo Fujimoto, and Noboru Miyazaki, ``Noise robust voice activity detection based on periodic to aperiodic component ratio,'' Speech Communication, vol. 52, no. 1, pp. 41-60, Jan. 2010.
Hiroko Kato, Kentaro Ishizuka, Masakiyo Fujimoto, ``A voice activity detection based on an adjustable linear prediction and GARCH models,'' Speech Communication, vol. 50, no. 6, pp. 476-486, June 2008.
Masakiyo Fujimoto and Kentaro Ishizuka, ``Noise robust voice activity detection based on switching Kalman filter,'' IEICE Transactions on Information and Systems, vol. E91-D, no. 3, pp. 467-477, March 2008.
Hiroko Kato, Kentaro Ishizuka, Masakiyo Fujimoto, ``A voice activity detection based on an AR-GARCH model,'' IEICE Transactions on Information and Systems, vol. J90-D, no. 12, pp. 3210-3220, Dec. 2007. (in Japanese)
Masakiyo Fujimoto, Kazuya Takeda, and Satoshi Nakamura, ``CENSREC-3: An evaluation framework for Japanese speech recognition in real driving-car environments,'' IEICE Transactions on Information and Systems, vol. E89-D, no. 11, pp. 2783-2793, Nov. 2006.
Masakiyo Fujimoto and Satoshi Nakamura, ``A non-stationary noise suppression method based on particle filtering and Polyak averaging,'' IEICE Transactions on Information and Systems, vol. E89-D, no. 3, pp. 922-930, March 2006.
Masakiyo Fujimoto, Yasuo Ariki, and Shuji Doshita, ``Person recognition for news videos through multi-modal interaction,'' The Journal of ASJ, vol. 62, no. 3, pp. 182-192, March 2006. (in Japanese)
Masakiyo Fujimoto,Yasuo Ariki, and Hiroshi Matsumoto, ``Segmentation of goods catalog video into individual goods section by combination of speech and image information,'' IEICE Transactions on Information and Systems, vol. J89-D-II, no. 2, pp. 292-304, Feb. 2006. (in Japanese)
Masakiyo Fujimoto and Yasuo Ariki, ``Additive and convolutive noise suppression method based on GMM and EM algorithm,'' IEICE Transactions on Information and Systems, col. J88-D-II, no. 7, pp. 1093-1102, July 2005. (in Japanese)
Satoshi Nakamura, Kazuya Takeda, Kazumasa Yamamoto, Takeshi Yamada, Shingo Kuroiwa, Norihide Kitaoka, Takanobu Nishiura, Akira Sasou, Mitsunori Mizumachi, Chiyomi Miyajima, Masakiyo Fujimoto, and Toshiki Endo, ``AURORA-2J, An evaluation framework for Japanese noisy speech recognition,'' IEICE Transactions on Information and Systems, vol. E88-D, no. 3, pp. 535-544, March 2005.
Masakiyo Fujimoto and Yasuo Ariki, ``Combination of GMM based speech estimation method and temporal domain SVD-based speech enhancement for noise robust speech recognition,'' IEICE Transactions on Information and Systems, vol. J88-D-II, no. 2, pp. 250-265, Feb. 2005. (in Japanese)
Yasuo Ariki, Jun Ogata, Masakiyo Fujimoto, and Kiyoshi Tsukada, ``Sports live speech recognition using acoustic and language model adaptation,'' IEICE Transactions on Information and Systems, vol. J87-D-II, no. 6, pp. 1208-1215, June 2004. (in Japanese)
Masakiyo Fujimoto and Yasuo Ariki, ``Speech recognition under noisy environments using speech signal estimation method based on Kalman filter,'' IEICE Transactions on Information and Systems, vol. J85-D-II, no. 1, pp. 1-11, Jan. 2002. (in Japanese)

[Page top]

Short paper

Masakiyo Fujimoto, Yasuo Ariki, and Shuji Doshita, ``Hands-free speech recognition in real environments using microphone array and 2-levels MLLR adaptation as a front-end system for conversational TV,'' Acoustical Science and Technology, vol. 24, no. 6, pp. 379-381, Nov. 2003.

[Page top]

International conferences

Masakiyo Fujimoto and Hisashi Kawai, ``One-Pass Single-channel noisy speech recognition using a combination of noisy and enhanced features,'' in Proceedings of Interspeech '19, pp. 486-490, Sept. 2019.
Masakiyo Fujimoto and Hisashi Kawai, ``Comparative evaluations of various factored deep convolutional RNN architectures for noise robust speech recognition,'' in Proceedings of ICASSP '18, pp. 4829-4833, Apr. 2018.
Masakiyo Fujimoto, ``Factored deep convolutional neural networks for noise robust speech recognition,'' in Proceedings of Interspeech '17, pp. 3837-3841, Aug. 2017.
Masakiyo Fujimoto and Tomohiro Nakatani, ``Multi-pass feature enhancement based on generative-discriminative hybrid approach for noise robust speech recognition,'' in Proceedings of ICASSP '16, pp. 5750-5754, March 2016.
Hendrik Meutzner, Shoko Araki, Masakiyo Fujimoto, and Tomohiro Nakatani, ``A generative-discriminative hybrid approach to multi-channel noise reduction for robust automatic speech recognition.'' in Proceedings of ICASSP '16, pp. 5740-5744, March 2016.
Tomoko Kawase, Kenta Niwa, Masakiyo Fujimoto, Noriyoshi Kamado, Kazunori Kobayashi, Shoko Araki, and Tomohiro Nakatani, ``Real-time integration of statistical model-based speech enhancement with unsupervised noise psd estimation using microphone array,'' in Proceedings of ICASSP '16, pp. 604-608, March 2016.
Takuya Yoshioka, Nobutaka Ito, Marc Delcroix, Atsunori Ogawa, Keisuke Kinoshita, Masakiyo Fujimoto, Chengzhu Yu, Wojciech J. Fabian, Miquel Espi, Takuya Higuchi, Shoko Araki, and Tomohiro Nakatani, ``The NTT CHiME3 system: Advances in speech enhancement and recognition for mobile multi-microphone devices, '' in Proceedings of ASRU '15, pp. 436-443, Dec. 2015.
Miquel Espi, Masakiyo Fujimoto, Keisuke Kinoshita, and Tomohiro Nakatani, ``On the importance of feature extraction for acoustic event detection using deep neural networks,'' in Proceedings of Interspeech '15, pp. 2922-2926, Sept. 2015.
Masakiyo Fujimoto and Tomohiro Nakatani, ``Feature enhancement based on generative-discriminative hybrid approach with GMMs and DNNs for noise robust speech recognition,'' in Proceedings of ICASSP '15, pp.5019-5023, Apr. 2015.
Shoko Araki, Tomoki Hayashi, Marc. Delcroix, Masakiyo Fujimoto, Kazuya Takeda, and Tomohiro Nakatani, ``Exploring multi-channel features for denoising-autoencoder-based speech enhancement,'' in Proceedings of ICASSP '15, pp. 116-120, Apr. 2015.
Marc Delcroix, Takuya Yoshioka, Atsunori Ogawa, Yotaro Kubo, Masakiyo Fujimoto, Nobutaka Ito, Keisuke Kinoshita, Miquel Espi, Shoko Araki, Takaaki Hori, Tomohiro Nakatani, ``Defeating reverberation: Advanced dereverberation and recognition techniques for hands-free speech recognition,'' in Proceedings of Global SIP, Dec. 2014. (invited talk)
Masakiyo Fujimoto, Yotaro Kubo, and Tomohiro Nakatani, ``Unsupervised non-parametric Bayesian modeling of non-stationary noise for model-based noise suppression,'' in Proceedings of ICASSP '14, pp. 5562-5566, May 2014.
Miquel Espi, Masakiyo Fujimoto,, Yotaro Kubo, and Tomohiro Nakatani, ``Spectrogram patch based acoustic event detection and classification in speech overlapping conditions,'' in Proceedings of HSCMA '14, pp. 117-121, May 2014.
Masakiyo Fujimoto and Tomohiro Nakatani, ``Model-based noise suppression using unsupervised estimation of hidden Markov model for non-stationary noise,'' in Proceedings of Interspeech '13, pp. 2982-2986, Aug. 2013.
Seong-Jun Hahm, Atsunori Ogawa, Marc Delcroix, Masakiyo Fujimoto, Takaaki Hori, and Atsushi Nakamura, ``Feature space variational Bayesian linear regression and its combination with model space VBLR,'' in Proceedings of ICASSP '13, pp. 7898-7902, May 2013.
Seong-Jun Hahm, Atsunori Ogawa, Masakiyo Fujimoto, Takaaki Hori, and Atsushi Nakamura, ``Speaker adaptation using variational Bayesian linear regression in normalized feature space,'' in Proceedings of Interspeech '12, Aug 2012.
Masakiyo Fujimoto and Tomohiro Nakatani, ``A reliable data selection for model-based noise suppression using unsupervised joint speaker adaptation and noise model estimation,'' in Proceedings of ICSPCC '12, pp. 4713-4716, Aug 2012. (invited talk)
Seong-Jun Hahm, Shinji Watanabe, Masakiyo Fujimoto, Atsunori Ogawa, Takaaki Hori, and Atsushi Nakamura, ``Normalization and adaptation by consistently employing MAP estimation,'' in Proceedings of IWSML '12, March 2012.
Masakiyo Fujimoto, Shinji Watanabe, and Tomohiro Nakatani, ``Noise suppression with unsupervised joint speaker adaptation and noise mixture model estimation,'' in Proceedings of ICASSP '12, pp. 4713-4716, March 2012.
Miquel Espi, Masakiyo Fujimoto, Daisuke Saito, Nobutaka Ono, Shigeki Sagayama, ``A tandem connectionist model using combination of multi-scale spectro-temporal features for acoustic event detection,'' in Proceedings of ICASSP '12, pp. 4293-4296, March 2012.
Tomohiro Nakatani, Takuya Yoshioka, Shoko Araki, Marc Delcroix, Masakiyo Fujimoto, ``Logmax observation model with mfcc-based spectral prior for reduction of highly nonstationary ambient noise,'' in Proceedings of ICASSP '12, pp. 4029-4032, March 2012.
Marc Delcroix, Keisuke Kinoshita, Tomohiro Nakatani, Shoko Araki, Atsunori Ogawa, Takaaki Hori, Shinji Watanabe, Masakiyo Fujimoto, Takuya Yoshioka, Takanobu Oba, Yotaro Kubo, Mehrez Souden, Seong-Jun Hahm, and Atsushi Nakamura, ``Speech recognition in the presence of highly non-stationary noise based on spatial, spectral and temporal speech/noise modeling combined with dynamic variance adaptation,'' in Proceedings of The PASCAL CHiME challenge, pp. 12-17, Sept. 2011.
Masakiyo Fujimoto, Shinji Watanabe, and Tomohiro Nakatani, ``A robust estimation method of noise mixture model for noise suppression,'' in Proceedings of Interspeech '11, pp. 697-700, Aug. 2011.
Tomohiro Nakatani, Shoko Araki, Marc Delcroix, Takuya Yoshioka, Masakiyo Fujimoto, ``Rapidly time-varying ambient noise reduction for robust ASR integrating spectral and locational characteristics of speech and noise,'' in Proceedings of Interspeech '11, pp. 1785-1789, Aug. 2011.
Shoko Araki, Takaaki Hori, Takuya Yoshioka, Masakiyo Fujimoto, Shinji Watanabe, Takanobu Oba, Atsunori Ogawa, Kazuhiro Otsuka, Dan Mikami, Keisuke Kinoshita, Tomohiro Nakatani, Atsushi Nakamura, Junji Yamato, ``Low-latency meeting recognition and understanding using distant microphones,'' in Proceedings of HSCMA '11, May 2011.
Masakiyo Fujimoto, Shinji Watanabe, and Tomohiro Nakatani, ``Non-stationary noise estimation method based on bias-residual component decomposition for robust speech recognition,'' in Proceedings of ICASSP '11, pp. 4816-4819, May 2011.
Tomohiro Nakatani, Shoko Araki, Takuya Yoshioka, and Masakiyo Fujimoto, ``Joint unsupervised learning of hidden Markov models and source loaction models for multichannel source separation,'' in Proceedings of ICASSP '11, pp. 237-240, May 2011.
Takaaki Hori, Shoko Araki, Takuya Yoshioka, Masakiyo Fujimoto, Shinji Watanabe, Takanobu Oba, Atsunori Ogawa, Kazuhiro Otsuka, Dan Mikami, Keisuke Kinoshita, Tomohiro Nakatani, Atsushi Nakamura, Junji Yamato, ``Real-time meeting recognition and understanding using distant microphones and omni-directional camera,'' in Proceedings of SLT '10, pp. 412-417, Dec. 2010.
Masakiyo Fujimoto, Shinji Watanabe, Tomohiro Nakatani, ``Voice activity detection using frame-wise model re-estimation method based on Gaussian pruning with weight normalization,'' in Proceedings of Interspeech '10, pp. 3102-3105, Sept. 2010.
Tomohiro Nakatani, Shoko Araki, Takuya Yoshioka, Masakiyo Fujimoto, ``Multichannel source separation based on source location cue with log-spectral shaping by hidden Markov source model,'' in Proceedings of Interspeech '10, pp. 2766-2769, Sept. 2010.
Satoshi Tamura, Chiyomi Miyajima, Norihide Kitaoka, Takeshi Yamada, Satoru Tsuge, Tetsuya Takiguchi, Kazumasa Yamamoto, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Shigeki Matsuda, Tetsuji Ogawa, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura, ``CENSREC-1-AV: An audio-visual corpus for noisy bimodal speech recognition,'' in Proceedings of AVSP '10, Sept. 2010.
Kentaro Ishizuka, Shoko Araki, Kazuhiro Otsuka, Tomohiro Nakatani, and Masakiyo Fujimoto, ``A speaker diarization method based on the probabilistic fusion of audio-visual location information,'' in Proceedings of ICMI-MLMI '09, pp. 55-62, Nov. 2009.
Masakiyo Fujimoto, Kentaro Ishizuka, and Tomohiro Nakatani, ``A study of mutual front-end processing method based on statistical model for noise robust speech recognition,'' in Proceedings of Interspeech '09, pp. 1235-1238, Sept. 2009.
Kazuhiro Otsuka, Shoko Araki, Kentaro Ishizuka, Masakiyo Fujimoto, Martin Heinrich, and Junji Yamato, ``A real-time multimodal system for analyzing group meetings by combining face pose tracking and speaker diarization,'' in Proceedings of ICMI '08, pp. 257-264, Oct. 2008.
Masakiyo Fujimoto, Kentaro Ishizuka, and Tomohiro Nakatani, ``Study of integration of statistical model-based voice activity detection and noise suppression,'' in Proceedings of Interspeech '08, pp. 2008-2011, Sept. 2008.
Masato Nakayama, Takanobu Nishiura, Yuki Denda, Norihide Kitaoka, Kazumasa Yamamoto, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Tetsuji Ogawa, Shigeki Matsuda, Shingo Kuroiwa, Kazuya Takeda and Satoshi Nakamura, ``CENSREC-4: Development of evaluation framework for distant-talking speech recognition under reverberant environments,'' in Proceedings of Interspeech '08, pp 968-971, Sept. 2008.
Tobias Hager, Shoko Araki, Kentaro Ishizuka, Masakiyo Fujimoto, Tomohiro Nakatani, and Shoji Makino, ``Handling speaker position changes in a meeting diarization system by combining DOA clustering and speaker identification,'' in Proceedings of IWAENC '08, Sept. 2008.
Takanobu Nishiura, Masato Nakayama, Yuki Denda, Norihide Kitaoka, Kazumasa Yamamoto, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Shingo Kuroiwa, Kazuya Takeda and Satoshi Nakamura, ``Evaluation framework for distant-talking speech recognition under reverberant environments - Newest part of the CENSREC series -,'' in Proceedings of LREC '08, May 2008.
Shoko Araki, Masakiyo Fujimoto, Kentaro Ishizuka, Hiroshi Sawada, and Shoji Makino, ``A DOA based speaker diarization system for real meetings,'' in Proceedings of HSCMA '08, pp. 29-32, May 2008.
Masakiyo Fujimoto, Kentaro Ishizuka, and Tomohiro Nakatani, ``A voice activity detection based on the adaptive integration of multiple speech features and a signal decision scheme,'' in Proceedings of ICASSP '08, pp. 4441-4444, Apr. 2008.
Shoko Araki, Masakiyo Fujimoto, Kentaro Ishizuka, Hiroshi Sawada, and Shoji Makino, ``Speaker indexing and speech enhancement in real meetinrgs / conversations,'' in Proceedings of ICASSP '08, pp. 93-96, Apr. 2008.
Norihide Kitaoka, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Kazumasa Yamamoto, Tetuya Takiguchi, Satoshi Tamura, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura, ``Development of VAD evaluation framework CENSREC-1-C and investigation of relationship between VAD and speech recognition performance,'' in Proceedings of ASRU '07, pp. 607-612, Dec. 2007.
Masakiyo Fujimoto and Kentaro Ishizuka, ``Noise robust voice activity detection based on switching Kalman filtering,'' in Proceedings of Eurospeech '07, pp. 2933-2936, Aug. 2007.
Kentaro Ishizuka, Tomohiro Nakatani, Masakiyo Fujimoto, and Noboru Miyazaki, ``Noise robust front-end with voice activity detection based on periodic to aperiodic component ratio,'' in Proceedings of Eurospeech '07, pp. 230-233, Aug. 2007.
Masakiyo Fujimoto, Kentaro Ishizuka, and Hiroko Kato, ``Noise robust voice activity detection based on statistical model and parallel non-linear Kalman filtering,'' in Proceedings of ICASSP '07, vol. IV, pp. 797-800, Apr 2007.
Juan E. Rubio, Kentaro Ishizuka, Hiroshi Sawada, Shoko Araki, Tomohiro Nakatani, and Masakiyo Fujimoto, ``Two-microphone voice activity detection based on the homogeneity of the direction of arrival estimates,'' in Proceedings of ICASSP '07, vol. IV, pp. 385-388, Apr 2007.
Satoshi Nakamura, Masakiyo Fujimoto, and Kazuya Takeda, ``CENSREC2: Corpus and evaluation environments for in car continuous digit speech recognition,'' in Proceedings of ICSLP '06, pp. 2330-2333, Sept. 2006.
Masakiyo Fujimoto and Satoshi Nakamura, ``Sequential non-stationary noise tracking using particle filtering with switching dynamical system,'' in Proceedings of ICASSP '06, vol. I, pp. 769-772, May 2006.
Masakiyo Fujimoto, Kazuya Takeda, and Satoshi Nakamura, ``CENSREC-3: An evaluation database for in-car speech recognition and its common evaluation framework,'' in Proceedings of Oriental COCOSDA '05, pp. 44-49, Dec. 2005.
Masakiyo Fujimoto and Satoshi Nakamura, ``Particle filtering and Polyak averaging-based non-stationary noise tracking for ASR in noise,'' in Proceedings of ASRU '05, pp. 337-342, Nov. 2005.
Wolfgang Herbordt, Toshiharu Horiuchi, Masakiyo Fujimoto, Takatoshi Jitsuhito, and Satoshi Nakamura, ``Hands-free speech recognition and communication on PDAs using microphone array technology,'' in Proceedings of ASRU '05, pp. 302-307, Nov. 2005.
Masakiyo Fujimoto and Satoshi Nakamura, ``Robust speech recognition in both non-stationary additive noise and reverberant environments based on particle filtering,'' in Proceedings of NSIP '05, pp. 314-319, May 2005.
Masakiyo Fujimoto, Satoshi Nakamura, Kazuya Takeda, Shingo Kuroiwa, Takeshi Yamada, Norihide Kitaoka, Kazumasa Yamamoto, Mitsunori Mizumachi, Takanobu Nishiura, Akira Sasou, Chiyomi Miyajima, and Toshiki Endo, ``CENSREC-3: An evaluation framework for Japanese speech recognition in real driving car environments,'' in Proceedings of RWCinME '05, pp. 53-60, Apr. 2005.
Masakiyo Fujimoto and Satoshi Nakamura, ``Particle filter based non-stationary noise tracking for robust speech recognition,'' in Proceedings of ICASSP '05, vol. I, pp. 257-260, March 2005.
Satoshi Nakamura, Kazumasa Yamamoto, Kazuya Takeda, Shingo Kuroiwa, Norihide Kitaoka, Takeshi Yamada, Mitsunori Mizumachi, Takanobu Nishiura, Masakiyo Fujimoto, Akira Sasou, and Toshiki Endo, ``AURORA2-J: Japanese speech data collection for performance evaluation of speech recognition in noise,'' in Proceedings of ICSLT '04, Nov. 2004.
Masakiyo Fujimoto and Yasuo Ariki, ``Robust speech recognition in additive and channel noise environments using GMM and EM algorithm,'' in Proceedings of ICASSP '04, vol. I, pp. 941-944, May 2004.
Satoshi Nakamura, Kazumasa Yamamoto, Kazuya Takeda, Shingo Kuroiwa, Norihide Kitaoka, Takeshi Yamada, Mitsunori Mizumachi, Takanobu Nishiura, Masakiyo Fujimoto, Akira Sasou, and Toshiki Endo, ``Data collection and evaluation of AURORA2-J Japanese corpus,'' in Proceedings of ASRU '03, pp. 619-623, Dec. 2003.
Masakiyo Fujimoto, Yasuo Ariki, and Hiroshi Matsumoto, ``Full automatic segmentation of goods catalog video into individual goods section by integrating speech and image information,'' in Proceedings of CBMI '03, pp. 35-40, Sept. 2003.
Masakiyo Fujimoto and Yasuo Ariki, ``Combination of temporal domain SVD based speech enhancement and GMM based speech estimation for ASR in noise - Evaluation on the AURORA2 task -,'' in Proceedings of Eurospeech '03, pp. 1781-1784, Sept. 2003.
Yasuo Ariki, Takeru Shigemori, Tsuyoshi Kaneko, Jun Ogata, and Masakiyo Fujimoto, ``Live speech recognition in sports games by adaptation of acoustic model and language model,'' in Proceedings of Eurospeech '03, pp. 1453-1456, Sept. 2003.
Takeshi Yamada, Jiro Okada, Kazuya Takeda, Norihide Kitaoka, Masakiyo Fujimoto, Shingo Kuroiwa, Kazumasa Yamamoto, Takanobu Nishiura, Mitsunori Mizumachi, and Satoshi Nakamura, ``Integration of noise reduction algorithms for AURORA2 task,'' in Proceedings of Eurospeech '03, pp. 1769-1772, Sept. 2003.
Yasuo Ariki, Masakiyo Fujimoto, Natsuo Yamamoto, and Masahito Kumano, ``Human information retrieval based on face recognition in video image through multi-modal interaction using speech and hand pointing action,'' in Proceedings of HCI International '03, vol. II, pp. 586-590, June 2003.
Masakiyo Fujimoto and Yasuo Ariki, ``Noise robust hands-free speech recognition using microphone array and Kalman filter as front-end system of conversational TV,'' in Proceedings of MMSP '02, Dec. 2002.
Masakiyo Fujimoto and Yasuo Ariki, ``Evaluation of noisy speech recognition based on noise reduction and acoustic model adaptation on the AURORA2 tasks,'' in Proceedings of ICSLP '02, vol. I, pp. 465-468, Sept. 2002.
Masakiyo Fujimoto and Yasuo Ariki, ``Speech recognition under musical environments using Kalman filter and iterative MLLR adaptation,'' in Proceedings of Eurospeech '01, vol. III, pp. 1879-1882, Sept. 2001.
Masakiyo Fujimoto and Yasuo Ariki, ``Continuous speech recognition under non-stationary musical environments based on speech state transition model,'' in Proceedings of ICASSP '01, vol. I, pp. 297-300, May 2001.
Masakiyo Fujimoto, Jun Ogata, and Yasuo Ariki, ``Large vocabulary continuous speech recognition under real environments using adaptive sub-band spectral subtraction,'' in Proceedings of ICSLP '00, vol. I, pp. 305-308, Oct. 2000.
Masakiyo Fujimoto and Yasuo Ariki, ``Noisy speech recognition using noise reduction method based on Kalman filter,'' in Proceedings of ICASSP '00, vol. III, pp. 1723-1726, June 2000.

[Page top]

Technical reports

Shoko Araki, Masakiyo Fujimoto, Takuya Yoshioka, Marc Delcroix, Miquel Espi, and Tomohiro Nakatani ``Deep learning based distant-talking speech processing in real-world sound environments,'' NTT Technical Review, vol. 13 no. 11, Nov. 2015.
Hirokazu Masataki, Taichi Asami, Shoko Yamahata, and Masakiyo Fujimoto, ``Speech recognition technology that can adapt to changes in service and environment,'' NTT Technical Review, vol. 11 no. 7, July 2013.
Masakiyo Fujimoto, ``The fundamentals, trends, and recent advances of voice activiy deteciton,'' The Journal of the IEICE, vol. 95, no. 8, pp. 754-758, Aug. 2012. (in Japanese)
Takahiro Fukumori, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Norihide Kitaoka, Takeshi Yamada, Kazumasa Yamamoto, Satoru Tsuge, Masakiyo Fujimoto, Tetsuya Takiguchi, Chiyomi Miyajima, Satoshi Tamura, Tetsuji Ogawa, Shigeki Matsuda, Shingo Kuroiwa, Kazuya Takeda, and Satoshi Nakamura, ``CENSREC-4: An evaluation framework for distant-talking speech recognition under reverberant environments,'' Acoustical Science and Technology, vol. 32, no. 5, pp. 201-210, Sept. 2011.
Norihide Kitaoka, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Kazumasa Yamamoto, Takanobu Nishiura, Yuki Denda, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Shigeki Matsuda, Tetsuji Ogawa, Shingo Kuroiwa, Kazuya Takeda, and Satoshi Nakamura, ``CENSREC-1-C: An evaluation framework for voice activity detection under noisy environments,'' Acoustical Science and Technology, vol. 30, no. 5, pp. 363-371, Sept. 2009.
Kentaro Ishizuka, Masakiyo Fujimoto, Tomohiro Nakatani, ``Advances in voice activity detection,'' The Journal of the ASJ, vol. 65, no. 10, pp. 537-543, Oct. 2009. (in Japanese)

[Page top]

Last update: 2020/11/01

Dr. Masakiyo Fujimoto, National Institute of Information and Communications Technology