論文の概要: SAHMM-VAE: A Source-Wise Adaptive Hidden Markov Prior Variational Autoencoder for Unsupervised Blind Source Separation
- arxiv url: http://arxiv.org/abs/2603.25776v1
- Date: Thu, 26 Mar 2026 13:08:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.207962
- Title: SAHMM-VAE: A Source-Wise Adaptive Hidden Markov Prior Variational Autoencoder for Unsupervised Blind Source Separation
- Title(参考訳): SAHMM-VAE:教師なしブラインド音源分離のための適応型隠れマルコフ前変分オートエンコーダ
- Authors: Yuan-Hao Wei,
- Abstract要約: SAHMM-VAEは、教師なしブラインドソース分離のための変分自動エンコーダである。
我々は1つの共通フレームワーク内に3つの分岐を開発する: ガウス放出HMM前、マルコフスイッチング自己回帰HMM前、および状態ワイド自己回帰フロー変換によるHMM状態フロー前、である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose SAHMM-VAE, a source-wise adaptive Hidden Markov prior variational autoencoder for unsupervised blind source separation. Instead of treating the latent prior as a single generic regularizer, the proposed framework assigns each latent dimension its own adaptive regime-switching prior, so that different latent dimensions are pulled toward different source-specific temporal organizations during training. Under this formulation, source separation is not implemented as an external post-processing step; it is embedded directly into variational learning itself. The encoder, decoder, posterior parameters, and source-wise prior parameters are optimized jointly, where the encoder progressively learns an inference map that behaves like an approximate inverse of the mixing transformation, while the decoder plays the role of the generative mixing model. Through this coupled optimization, the gradual alignment between posterior source trajectories and heterogeneous HMM priors becomes the mechanism through which different latent dimensions separate into different source components. To instantiate this idea, we develop three branches within one common framework: a Gaussian-emission HMM prior, a Markov-switching autoregressive HMM prior, and an HMM state-flow prior with state-wise autoregressive flow transformations. Experiments show that the proposed framework achieves unsupervised source recovery while also learning meaningful source-wise switching structures. More broadly, the method extends our structured-prior VAE line from smooth, mixture-based, and flow-based latent priors to adaptive switching priors, and provides a useful basis for future work on interpretable and potentially identifiable latent source modeling.
- Abstract(参考訳): 教師なしブラインドソース分離のための変分自動符号化器であるSAHMM-VAEを提案する。
提案フレームワークは、潜伏次元を単一の汎用正規化器として扱う代わりに、各潜伏次元を適応的レギュレーションスイッチング事前に割り当て、トレーニング中に異なる潜伏次元を異なるソース固有の時間的組織に引き上げる。
この定式化の下では、ソース分離は外部の処理後ステップとして実装されず、変分学習そのものに直接組み込まれている。
エンコーダ、デコーダ、後続パラメータ、およびソースワイド事前パラメータを共同で最適化し、そこでは、デコーダが生成混合モデルの役割を担っている間、エンコーダは、混合変換の近似逆として振る舞う推論マップを徐々に学習する。
この結合最適化により、後方の軌跡とヘテロジニアスHMM事前との漸進的なアライメントは、異なる遅延次元を異なるソース成分に分離するメカニズムとなる。
このアイデアをインスタンス化するために、我々は、Gussian-emission HMM、Markov-switching Autoregressive HMM、HMM state-flow before with state-wise Autoregressive Flow transformationsという3つの共通フレームワーク内で3つのブランチを開発する。
実験の結果,提案フレームワークは教師なしのソースリカバリを実現するとともに,有意義なソースワイド・スイッチング構造を学習していることがわかった。
より広範に、本手法は、構造上最優先のVAE線を、スムーズで混合型、フローベースの潜水前処理から適応切換前処理まで拡張し、解釈可能かつ潜在的に同定可能な潜水後処理のための有用な基盤を提供する。
関連論文リスト
- PDGMM-VAE: A Variational Autoencoder with Adaptive Per-Dimension Gaussian Mixture Model Priors for Nonlinear ICA [1.7403133838762448]
独立したコンポーネント分析は、ブラインドソース分離の中核となるフレームワークである。
本稿では,ソース指向の変分オートエンコーダPDGMM-VAEを提案する。
線形および非線形混合問題の実験的結果は、PDGMM-VAEが遅延音源信号を復元できることを証明している。
論文 参考訳(メタデータ) (2026-03-20T08:54:35Z) - AR-Flow VAE: A Structured Autoregressive Flow Prior Variational Autoencoder for Unsupervised Blind Source Separation [1.4174475093445233]
盲点分離のための新しいVAEベースのフレームワークであるAR-Flow VAEを提案する。
この研究は、AR-Flow VAEの識別可能性と解釈可能性に関する今後の研究の基礎を提供する。
論文 参考訳(メタデータ) (2026-03-15T15:35:51Z) - Simulating Distribution Dynamics: Liquid Temporal Feature Evolution for Single-Domain Generalized Object Detection [58.25418970608328]
Single-Domain Generalized Object Detection (Single-DGOD)は、あるソースドメインで訓練された検出器を複数の未知のドメインに転送することを目的としている。
シングルDGODの既存の方法は通常、データの多様性を拡大するために離散的なデータ拡張や静的摂動法に依存している。
そこで本研究では,ソース領域から潜伏分布のシミュレーションに至るまでの機能の進化をシミュレートする手法を提案する。
論文 参考訳(メタデータ) (2025-11-13T03:10:39Z) - Progressive Multi-Source Domain Adaptation for Personalized Facial Expression Recognition [64.37805399216347]
パーソナライズされた表情認識(FER)では、ラベル付きソースとラベルなしターゲットドメインのサンプルを使用して機械学習モデルを適用する。
本稿では,対象者との類似性に基づいて,段階的なMSDA手法を提案する。
論文 参考訳(メタデータ) (2025-04-05T19:14:51Z) - Heterogenous Multi-Source Data Fusion Through Input Mapping and Latent Variable Gaussian Process [8.32027826756131]
提案するフレームワークは,3つの工学的ケーススタディに基づいて実証および解析を行った。
単一のソースモデルに対して予測精度が向上し、変換されるがソースモデルは認識されない。
論文 参考訳(メタデータ) (2024-07-15T22:27:04Z) - Dior-CVAE: Pre-trained Language Models and Diffusion Priors for
Variational Dialog Generation [70.2283756542824]
Dior-CVAEは階層型条件変分オートエンコーダ(CVAE)である。
拡散モデルを用いて、従来の分布の複雑さを増大させ、PLMが生成した分布との整合性を高める。
2つのオープンドメインダイアログデータセットを対象とした実験により,大規模ダイアログ事前学習を必要とせずに,より多様な応答を生成できることが判明した。
論文 参考訳(メタデータ) (2023-05-24T11:06:52Z) - SIReN-VAE: Leveraging Flows and Amortized Inference for Bayesian
Networks [2.8597160727750564]
この研究はベイジアンネットワークによって定義された任意の依存構造をVAEに組み込むことを検討する。
これは、事前と推論のネットワークをグラフィカルな残留フローで拡張することで実現される。
モデルの性能をいくつかの合成データセットで比較し、データスパース設定におけるその可能性を示す。
論文 参考訳(メタデータ) (2022-04-23T10:31:08Z) - Generalize then Adapt: Source-Free Domain Adaptive Semantic Segmentation [78.38321096371106]
先行技術はラベル付きソースとラベルなしターゲットの両方への同時アクセスを前提としており、ソースフリー適応を必要とするシナリオには適さない。
本研究では、タスクをa)ソースのみのドメイン一般化とb)ソースフリーなターゲット適応の2つに分割することで、ソースフリーのDAを可能にする。
本研究では,空間的不規則性を回避し,擬似ラベル品質を向上する条件付き事前強化オートエンコーダを提案する。
論文 参考訳(メタデータ) (2021-08-25T14:18:59Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - On the Encoder-Decoder Incompatibility in Variational Text Modeling and
Beyond [82.18770740564642]
変分オートエンコーダ(VAE)は、潜時変数と償却変分推論を結合する。
我々は,データ多様体のパラメータ化が不十分なエンコーダ・デコーダの不整合性を観察する。
同一構造を持つ決定論的オートエンコーダとVAEモデルを結合した結合型VAEを提案する。
論文 参考訳(メタデータ) (2020-04-20T10:34:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。