論文の概要: Sound Source Separation Using Latent Variational Block-Wise
Disentanglement
- arxiv url: http://arxiv.org/abs/2402.06683v1
- Date: Thu, 8 Feb 2024 07:22:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 19:56:48.995612
- Title: Sound Source Separation Using Latent Variational Block-Wise
Disentanglement
- Title(参考訳): 変分ブロック幅アンタングルを用いた音源分離
- Authors: Karim Helwani, Masahito Togami, Paris Smaragdis, Michael M. Goodwin
- Abstract要約: 本稿では,デジタル信号処理/ディープニューラルネットワーク(DSP/DNN)による音源分離手法を提案する。
古典的な信号処理理論結果によって動機づけられた課題の設計選択と変分定式化が,分布外のデータを見落とし,過度に適合するリスクの低減につながることを示す。
- 参考スコア(独自算出の注目度): 33.94867897638613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While neural network approaches have made significant strides in resolving
classical signal processing problems, it is often the case that hybrid
approaches that draw insight from both signal processing and neural networks
produce more complete solutions. In this paper, we present a hybrid classical
digital signal processing/deep neural network (DSP/DNN) approach to source
separation (SS) highlighting the theoretical link between variational
autoencoder and classical approaches to SS. We propose a system that transforms
the single channel under-determined SS task to an equivalent multichannel
over-determined SS problem in a properly designed latent space. The separation
task in the latent space is treated as finding a variational block-wise
disentangled representation of the mixture. We show empirically, that the
design choices and the variational formulation of the task at hand motivated by
the classical signal processing theoretical results lead to robustness to
unseen out-of-distribution data and reduction of the overfitting risk. To
address the resulting permutation issue we explicitly incorporate a novel
differentiable permutation loss function and augment the model with a memory
mechanism to keep track of the statistics of the individual sources.
- Abstract(参考訳): ニューラルネットワークアプローチは、古典的な信号処理問題を解決するために大きな進歩を遂げてきたが、信号処理とニューラルネットワークの両方から洞察を引き出すハイブリッドアプローチは、より完全なソリューションを生み出すことが多い。
本稿では、音源分離(SS)のための古典的ディジタル信号処理/ディープニューラルネットワーク(DSP/DNN)のハイブリッド手法を提案する。
本稿では,単一チャネル下決定SSタスクを,適切に設計された潜在空間において等価なマルチチャネル過決定SS問題に変換するシステムを提案する。
潜時空間における分離タスクは、混合のばらつきブロックワイズ非絡み合い表現として扱われる。
実験により,従来の信号処理理論結果に動機づけられたタスクの設計選択と変分定式化が,アウト・オブ・ディストリビューションデータの発見と過度なリスクの低減につながることを示す。
結果の置換問題に対処するため、新しい可変置換損失関数を明示的に組み込んで、個々のソースの統計を追跡するためのメモリ機構でモデルを拡張した。
関連論文リスト
- Domain Generalization Guided by Gradient Signal to Noise Ratio of
Parameters [69.24377241408851]
ソースドメインへのオーバーフィッティングは、ディープニューラルネットワークの勾配に基づくトレーニングにおいて一般的な問題である。
本稿では,ネットワークパラメータの勾配-信号-雑音比(GSNR)を選択することを提案する。
論文 参考訳(メタデータ) (2023-10-11T10:21:34Z) - Spectral-Bias and Kernel-Task Alignment in Physically Informed Neural
Networks [4.604003661048267]
物理情報ニューラルネットワーク(PINN)は微分方程式の解法として有望である。
この重要な問題に光を当てる包括的な理論的枠組みを提案する。
我々は、PINN予測を大容量データセット限界で支配する積分微分方程式を導出する。
論文 参考訳(メタデータ) (2023-07-12T18:00:02Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Neural Fast Full-Rank Spatial Covariance Analysis for Blind Source
Separation [26.6020148790775]
本稿では,ニューラルネットワーク分離モデルに対する効率的な教師なし学習手法について述べる。
本稿では,結合対角化可能なフルランク空間モデルに基づくニューラルFastFCAを提案する。
2〜4つの音源の混合信号を用いた実験により、ニューラルFastFCAは従来のBSS法よりも優れていた。
論文 参考訳(メタデータ) (2023-06-17T02:50:17Z) - Permutation Equivariant Neural Functionals [92.0667671999604]
この研究は、他のニューラルネットワークの重みや勾配を処理できるニューラルネットワークの設計を研究する。
隠れた層状ニューロンには固有の順序がないため, 深いフィードフォワードネットワークの重みに生じる置換対称性に着目する。
実験の結果, 置換同変ニューラル関数は多種多様なタスクに対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-02-27T18:52:38Z) - Decentralized Local Stochastic Extra-Gradient for Variational
Inequalities [125.62877849447729]
我々は、不均一(非IID)で多くのデバイスに分散する問題データを持つ領域上での分散変分不等式(VIs)を考察する。
我々は、完全に分散化された計算の設定を網羅する計算ネットワークについて、非常に一般的な仮定を行う。
理論的には, モノトン, モノトンおよび非モノトンセッティングにおける収束速度を理論的に解析する。
論文 参考訳(メタデータ) (2021-06-15T17:45:51Z) - Multivariate Deep Evidential Regression [77.34726150561087]
不確実性を認識するニューラルネットワークによる新しいアプローチは、従来の決定論的手法よりも有望である。
本稿では,レグレッションベースニューラルネットワークからアレータ性およびてんかん性不確かさを抽出する手法を提案する。
論文 参考訳(メタデータ) (2021-04-13T12:20:18Z) - Supervised training of spiking neural networks for robust deployment on
mixed-signal neuromorphic processors [2.6949002029513167]
混合信号アナログ/デジタル電子回路はスパイキングニューロンやシナプスを非常に高いエネルギー効率でエミュレートすることができる。
ミスマッチは、同一構成ニューロンとシナプスの効果的なパラメータの違いとして表現される。
ミスマッチに対する堅牢性や,その他の一般的なノイズ源を最大化することで,この課題に対処する,教師付き学習アプローチを提案する。
論文 参考訳(メタデータ) (2021-02-12T09:20:49Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Theory inspired deep network for instantaneous-frequency extraction and
signal components recovery from discrete blind-source data [1.6758573326215689]
本稿では、未知の信号成分を回収する逆問題と周波数の抽出について考察する。
既存の分解法やアルゴリズムでは、この逆問題を解くことはできない。
本稿では、ブラインドソース信号の非一様サンプリングが可能な離散サンプルセットを直接ベースとしたディープニューラルネットワークの合成を提案する。
論文 参考訳(メタデータ) (2020-01-31T18:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。