論文の概要: Audio Source Separation in Reverberant Environments using $β$-divergence based Nonnegative Factorization
- arxiv url: http://arxiv.org/abs/2604.12480v1
- Date: Tue, 14 Apr 2026 09:03:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.362044
- Title: Audio Source Separation in Reverberant Environments using $β$-divergence based Nonnegative Factorization
- Title(参考訳): $β$-divergence に基づく非負の分解による残響環境の音源分離
- Authors: Mahmoud Fakhry, Piergiorgio Svaizer, Maurizio Omologo,
- Abstract要約: 本稿では,情報源のばらつきに関する事前情報に基づいて,非負の因数分解を適用してパラメータを推定する。
実験では、分離性能を高めるために、トレーニングで$$に割り当てられる値ではなく、スパーシリティが重要であることが示された。
- 参考スコア(独自算出の注目度): 2.157879505316056
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Gaussian model-based multichannel audio source separation, the likelihood of observed mixtures of source signals is parametrized by source spectral variances and by associated spatial covariance matrices. These parameters are estimated by maximizing the likelihood through an Expectation-Maximization algorithm and used to separate the signals by means of multichannel Wiener filtering. We propose to estimate these parameters by applying nonnegative factorization based on prior information on source variances. In the nonnegative factorization, spectral basis matrices can be defined as the prior information. The matrices can be either extracted or indirectly made available through a redundant library that is trained in advance. In a separate step, applying nonnegative tensor factorization, two algorithms are proposed in order to either extract or detect the basis matrices that best represent the power spectra of the source signals in the observed mixtures. The factorization is achieved by minimizing the $β$-divergence through multiplicative update rules. The sparsity of factorization can be controlled by tuning the value of $β$. Experiments show that sparsity, rather than the value assigned to $β$ in the training, is crucial in order to increase the separation performance. The proposed method was evaluated in several mixing conditions. It provides better separation quality with respect to other comparable algorithms.
- Abstract(参考訳): ガウスモデルに基づくマルチチャンネル音源分離では、観測された音源信号の混合の可能性は、音源スペクトルのばらつきと関連する空間共分散行列によってパラメータ化される。
これらのパラメータは、期待-最大化アルゴリズムを用いて確率を最大化して推定され、マルチチャネルWienerフィルタを用いて信号を分離するために使用される。
本稿では,これらのパラメータを,ソースのばらつきに関する事前情報に基づいて非負の分解を適用して推定する。
非負の分解では、スペクトル基底行列を事前情報として定義することができる。
行列を抽出するか、事前にトレーニングされた冗長ライブラリを通じて間接的に利用することができる。
非負のテンソル因子化を適用した別のステップでは、観測された混合物中のソース信号のパワースペクトルを最もよく表す基底行列を抽出または検出するために、2つのアルゴリズムが提案される。
この分解は、乗法的な更新ルールによって$β$-divergenceを最小化する。
因子化の空間性は、$β$の値を調整することで制御できる。
実験により、分離性能を高めるために、トレーニングで$β$に割り当てられる値ではなく、スパーシリティが重要であることが示された。
提案手法は様々な混合条件下で評価された。
他の同等のアルゴリズムに対して、より良い分離品質を提供する。
関連論文リスト
- An Elementary Approach to Scheduling in Generative Diffusion Models [55.171367482496755]
生成拡散モデルにおけるノイズスケジューリングと時間離散化の影響を特徴付けるための基礎的手法を開発した。
異なるデータセットと事前訓練されたモデルにわたる実験により、我々のアプローチによって選択された時間離散化戦略が、ベースラインとサーチベースの戦略を一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-01-20T05:06:26Z) - Adaptive posterior distributions for uncertainty analysis of covariance matrices in Bayesian inversion problems for multioutput signals [0.0]
非線形多出力モデルのパラメータに対してベイズ推定を行う際の問題に対処する。
興味のある変数は2つのブロックに分割され、推論は既知の解析最適化公式を利用する。
論文 参考訳(メタデータ) (2025-01-02T09:01:09Z) - $\ell_0$ factor analysis [25.14792952830999]
低ランク成分に対する核ノルムを用いた最適化問題を定式化する。
最適化問題の解法として、交互最小化アルゴリズムを設計する。
アルゴリズムの有効性は、合成データセットと実データセットのシミュレーションによって検証される。
論文 参考訳(メタデータ) (2024-11-13T09:40:23Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Nonparametric Independent Component Analysis for the Sources with Mixed
Spectra [0.06445605125467573]
既存のICAプロシージャの多くは独立したサンプリングを前提としている。
2次統計に基づく音源分離法は, 自己相関源からの混合物のパラメトリック時系列モデルに基づいて開発されている。
本稿では,3次スプラインとインジケータ関数を用いて,音源信号のスペクトル密度関数と線スペクトルを推定し,新しいICA法を提案する。
論文 参考訳(メタデータ) (2022-12-13T02:13:14Z) - Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models [31.58736590532443]
混合一般化線形モデルにおいて、統計的に独立な2つの信号を推定する問題を考える。
我々の特徴付けは、ランダム行列、自由確率、および近似メッセージパッシングアルゴリズムの理論からのツールの混合を利用する。
論文 参考訳(メタデータ) (2022-11-21T11:35:25Z) - Blind Source Separation for Mixture of Sinusoids with Near-Linear
Computational Complexity [0.0]
本研究では, 基本正弦波の周波数, 振幅, 位相を雑音列で検出できるマルチトーン分解アルゴリズムを提案する。
正弦波源数を$M$で推定すると,その周波数を連続的に推定し,振幅と位相を共同で最適化する。
論文 参考訳(メタデータ) (2022-03-27T15:16:07Z) - Learning with Density Matrices and Random Features [44.98964870180375]
密度行列は、量子系の統計状態を記述する。
量子系の量子的不確実性と古典的不確実性の両方を表現することは強力な形式主義である。
本稿では,機械学習モデルのビルディングブロックとして密度行列をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2021-02-08T17:54:59Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z) - Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。
本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-02-08T21:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。