論文の概要: DiffSDA: Unsupervised Diffusion Sequential Disentanglement Across Modalities
- arxiv url: http://arxiv.org/abs/2510.05717v1
- Date: Tue, 07 Oct 2025 09:30:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.184103
- Title: DiffSDA: Unsupervised Diffusion Sequential Disentanglement Across Modalities
- Title(参考訳): DiffSDA: モダリティ全体での教師なし拡散シーケンスの絡み合い
- Authors: Hedi Zisling, Ilan Naiman, Nimrod Berman, Supasorn Suwajanakorn, Omri Azencot,
- Abstract要約: 本稿では,Diffusion Sequential Disentanglement Autoencoder (DiffSDA)を紹介する。
実世界の多種多様なベンチマーク実験により、DiffSDAは最近の最先端の手法よりも逐次的非絡み合いの方が優れていることが示された。
- 参考スコア(独自算出の注目度): 27.918193673708473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised representation learning, particularly sequential disentanglement, aims to separate static and dynamic factors of variation in data without relying on labels. This remains a challenging problem, as existing approaches based on variational autoencoders and generative adversarial networks often rely on multiple loss terms, complicating the optimization process. Furthermore, sequential disentanglement methods face challenges when applied to real-world data, and there is currently no established evaluation protocol for assessing their performance in such settings. Recently, diffusion models have emerged as state-of-the-art generative models, but no theoretical formalization exists for their application to sequential disentanglement. In this work, we introduce the Diffusion Sequential Disentanglement Autoencoder (DiffSDA), a novel, modal-agnostic framework effective across diverse real-world data modalities, including time series, video, and audio. DiffSDA leverages a new probabilistic modeling, latent diffusion, and efficient samplers, while incorporating a challenging evaluation protocol for rigorous testing. Our experiments on diverse real-world benchmarks demonstrate that DiffSDA outperforms recent state-of-the-art methods in sequential disentanglement.
- Abstract(参考訳): 非教師なし表現学習、特にシーケンシャルな不絡み合いは、ラベルに頼ることなく、データの変動の静的要因と動的要因を分離することを目的としている。
変分自己エンコーダと生成的敵ネットワークに基づく既存のアプローチは、最適化過程を複雑にし、しばしば複数の損失項に依存するため、これは難しい問題である。
さらに, 実世界のデータに適用した場合, 逐次的非絡合法は課題に直面しており, それらの性能を評価するための確立した評価プロトコルは存在しない。
近年、拡散モデルは最先端の生成モデルとして登場しているが、それらが逐次非絡み合いに応用する理論的な形式化は存在しない。
本稿では,DiffSDA(Diffusion Sequential Disentanglement Autoencoder)について紹介する。
DiffSDAは、厳密なテストのための挑戦的な評価プロトコルを取り入れながら、新しい確率的モデリング、潜伏拡散、効率的なサンプリングを利用する。
実世界の多種多様なベンチマーク実験により、DiffSDAは最近の最先端の手法よりも逐次的非絡み合いの方が優れていることが示された。
関連論文リスト
- Reliably Detecting Model Failures in Deployment Without Labels [14.331401006402979]
本稿では,デプロイ後劣化(PDD)モニタリングの問題点を定式化し,対処する。
本稿では,予測モデルの相違に基づく,実用的で効率的なモニタリングアルゴリズムD3Mを提案する。
標準ベンチマークと実世界の大規模内科データセットによる実証的な結果から,フレームワークの有効性が示された。
論文 参考訳(メタデータ) (2025-06-05T13:56:18Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Interleaved Gibbs Diffusion: Generating Discrete-Continuous Data with Implicit Constraints [30.624303845550575]
Interleaved Gibbs Diffusion (IGD)は、離散連続データのための新しい生成モデリングフレームワークである。
IGDは離散時間ギブスサンプリング型マルコフ連鎖を離散連続生成の場合に一般化する。
ドメイン固有の帰納バイアスに頼ることなく、最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-02-19T05:51:24Z) - ImDiffusion: Imputed Diffusion Models for Multivariate Time Series
Anomaly Detection [44.21198064126152]
我々はImDiffusionという新しい異常検出フレームワークを提案する。
ImDiffusionは時系列計算と拡散モデルを組み合わせて、正確で堅牢な異常検出を実現する。
我々はImDiffusionの性能をベンチマークデータセットの広範な実験により評価する。
論文 参考訳(メタデータ) (2023-07-03T04:57:40Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。