Blind source separation of convolutive mixtures of speech in frequency domain

Shoji Makino*, Hiroshi Sawada, Ryo Mukai, Shoko Araki

*この研究の対応する著者

研究成果: Review article査読

57 被引用数 (Scopus)

抄録

This paper overviews a total solution for frequency-domain blind source separation (BSS) of convolutive mixtures of audio signals, especially speech. Frequency-domain BSS performs independent component analysis (ICA) in each frequency bin, and this is more efficient than time-domain BSS. We describe a sophisticated total solution for frequency-domain BSS, including permutation, scaling, circularity, and complex activation function solutions. Experimental results of 2 × 2, 3 × 3, 4 × 4, 6 × 8, and 2 × 2 (moving sources), (#sources × #microphones) in a room are promising.

本文言語English
ページ(範囲)1640-1654
ページ数15
ジャーナルIEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
E88-A
7
DOI
出版ステータスPublished - 2005 7月
外部発表はい

ASJC Scopus subject areas

  • 信号処理
  • コンピュータ グラフィックスおよびコンピュータ支援設計
  • 電子工学および電気工学
  • 応用数学

フィンガープリント

「Blind source separation of convolutive mixtures of speech in frequency domain」の研究トピックを掘り下げます。これらがまとまってユニークなフィンガープリントを構成します。

引用スタイル