論文の概要: Unsupervised Source Separation via Bayesian Inference in the Latent
Domain
- arxiv url: http://arxiv.org/abs/2110.05313v1
- Date: Mon, 11 Oct 2021 14:32:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 20:50:10.743703
- Title: Unsupervised Source Separation via Bayesian Inference in the Latent
Domain
- Title(参考訳): 潜伏領域におけるベイズ推論による教師なし音源分離
- Authors: Michele Mancusi, Emilian Postolache, Marco Fumero, Andrea Santilli,
Luca Cosmo, Emanuele Rodol\`a
- Abstract要約: 最先端のオーディオソース分離モデルは、教師付きデータ駆動アプローチに依存している。
本稿では,時間領域信号の潜在表現を直接操作する,単純で効果的な非教師付き分離アルゴリズムを提案する。
Slakh データセット arXiv:1909.08494 に対する我々のアプローチを検証する。
- 参考スコア(独自算出の注目度): 4.583433328833251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State of the art audio source separation models rely on supervised
data-driven approaches, which can be expensive in terms of labeling resources.
On the other hand, approaches for training these models without any direct
supervision are typically high-demanding in terms of memory and time
requirements, and remain impractical to be used at inference time. We aim to
tackle these limitations by proposing a simple yet effective unsupervised
separation algorithm, which operates directly on a latent representation of
time-domain signals. Our algorithm relies on deep Bayesian priors in the form
of pre-trained autoregressive networks to model the probability distributions
of each source. We leverage the low cardinality of the discrete latent space,
trained with a novel loss term imposing a precise arithmetic structure on it,
to perform exact Bayesian inference without relying on an approximation
strategy. We validate our approach on the Slakh dataset arXiv:1909.08494,
demonstrating results in line with state of the art supervised approaches while
requiring fewer resources with respect to other unsupervised methods.
- Abstract(参考訳): 最先端のオーディオソース分離モデルは教師付きデータ駆動アプローチに依存しており、ラベル付けリソースの面では高価である。
一方で、直接の監督なしにこれらのモデルをトレーニングするためのアプローチは、通常、メモリと時間要件の観点から要求が高く、推論時に使用するには実用的でない。
我々は、時間領域信号の潜在表現に基づいて直接動作する単純かつ効果的な教師なし分離アルゴリズムを提案することで、これらの制限に取り組むことを目指している。
本アルゴリズムは,事前学習された自己回帰ネットワークの形で,各音源の確率分布をモデル化する深いベイズ前駆関数に依存する。
離散潜在空間の低濃度性を利用して、その上に正確な算術構造を与える新しい損失項で訓練し、近似戦略に頼ることなく正確なベイズ推定を行う。
我々は、slakhデータセットarxiv:1909.08494に対する我々のアプローチを検証するとともに、他の教師なしメソッドに対するリソースを少なくしながら、最先端の教師付きアプローチと一致した結果を示す。
関連論文リスト
- Align, Minimize and Diversify: A Source-Free Unsupervised Domain Adaptation Method for Handwritten Text Recognition [11.080302144256164]
Align, Minimize and Diversify (AMD) は、手書き文字認識(HTR)のための非教師なし領域適応手法である。
本手法は,3つの異なる正規化項を組み込むことで,適応中のソースデータの再検討の必要性を明確に排除する。
いくつかのベンチマークによる実験の結果、AMDの有効性とロバスト性を示し、HTRにおけるDA法よりも競争力があり、しばしば優れていた。
論文 参考訳(メタデータ) (2024-04-28T17:50:58Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Direct Unsupervised Denoising [60.71146161035649]
教師なしのデノイザは、MMSE推定のような単一の予測を直接生成しない。
本稿では,VAEと並んで決定論的ネットワークを訓練し,中心的な傾向を直接予測するアプローチを提案する。
論文 参考訳(メタデータ) (2023-10-27T13:02:12Z) - Observation-Guided Diffusion Probabilistic Models [41.749374023639156]
観測誘導拡散確率モデル(OGDM)と呼ばれる新しい拡散に基づく画像生成法を提案する。
本手法は,観測プロセスの指導をマルコフ連鎖と統合することにより,トレーニング目標を再構築する。
本研究では,強力な拡散モデルベースライン上での多様な推論手法を用いたトレーニングアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2023-10-06T06:29:06Z) - Exploiting Temporal Structures of Cyclostationary Signals for
Data-Driven Single-Channel Source Separation [98.95383921866096]
単一チャネルソース分離(SCSS)の問題点について検討する。
我々は、様々なアプリケーション領域に特に適するサイクロ定常信号に焦点を当てる。
本稿では,最小MSE推定器と競合するU-Netアーキテクチャを用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T14:04:56Z) - A Prototype-Oriented Framework for Unsupervised Domain Adaptation [52.25537670028037]
メモリと計算効率のよい確率的フレームワークを提供し、クラスプロトタイプを抽出し、ターゲットとなる特徴をそれらと整合させる。
本稿では,単一ソース,マルチソース,クラス不均衡,ソースプライベートドメイン適応など,幅広いシナリオにおいて,本手法の汎用性を実証する。
論文 参考訳(メタデータ) (2021-10-22T19:23:22Z) - A Curriculum-style Self-training Approach for Source-Free Semantic Segmentation [91.13472029666312]
ソースフリーなドメイン適応型セマンティックセマンティックセグメンテーションのためのカリキュラムスタイルの自己学習手法を提案する。
提案手法は, ソースフリーなセマンティックセグメンテーションタスクにおいて, 合成-実-実-実-実-実-実-非実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実
論文 参考訳(メタデータ) (2021-06-22T10:21:39Z) - Bayesian Imaging With Data-Driven Priors Encoded by Neural Networks:
Theory, Methods, and Algorithms [2.266704469122763]
本稿では,事前知識がトレーニングデータとして利用可能である逆問題に対して,ベイズ推定を行う新しい手法を提案する。
容易に検証可能な条件下で,関連する後方モーメントの存在と適切性を確立する。
モデル精度解析により、データ駆動モデルによって報告されるベイズ確率は、頻繁な定義の下で著しく正確であることが示された。
論文 参考訳(メタデータ) (2021-03-18T11:34:08Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Unsupervised Audio Source Separation using Generative Priors [43.35195236159189]
そこで本研究では,個々の音源から学習した生成的事前情報に基づく音源分離手法を提案する。
提案手法では,ソース固有の潜在空間を同時に探索し,構成源を効果的に回収する。
論文 参考訳(メタデータ) (2020-05-28T03:57:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。