論文の概要: Coupled Inference in Diffusion Models for Semantic Decomposition
- arxiv url: http://arxiv.org/abs/2602.09983v1
- Date: Tue, 10 Feb 2026 17:10:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.696349
- Title: Coupled Inference in Diffusion Models for Semantic Decomposition
- Title(参考訳): 意味的分解のための拡散モデルにおける結合推論
- Authors: Calvin Yeung, Ali Zakeri, Zhuowen Zou, Mohsen Imani,
- Abstract要約: 拡散モデルにおける結合推論を用いた意味分解のためのフレームワークを提案する。
提案手法は, 合成意味分解タスクの多岐にわたる共振器ネットワークより優れていることを示す。
- 参考スコア(独自算出の注目度): 9.847716738789392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many visual scenes can be described as compositions of latent factors. Effective recognition, reasoning, and editing often require not only forming such compositional representations, but also solving the decomposition problem. One popular choice for constructing these representations is through the binding operation. Resonator networks, which can be understood as coupled Hopfield networks, were proposed as a way to perform decomposition on such bound representations. Recent works have shown notable similarities between Hopfield networks and diffusion models. Motivated by these observations, we introduce a framework for semantic decomposition using coupled inference in diffusion models. Our method frames semantic decomposition as an inverse problem and couples the diffusion processes using a reconstruction-driven guidance term that encourages the composition of factor estimates to match the bound vector. We also introduce a novel iterative sampling scheme that improves the performance of our model. Finally, we show that attention-based resonator networks are a special case of our framework. Empirically, we demonstrate that our coupled inference framework outperforms resonator networks across a range of synthetic semantic decomposition tasks.
- Abstract(参考訳): 多くの視覚シーンは、潜伏因子の合成として記述できる。
効果的な認識、推論、編集は、しばしばそのような構成表現を形成するだけでなく、分解問題を解く必要がある。
これらの表現を構築するための一般的な選択は、バインディング操作である。
このような有界表現の分解を行う手段として,共振器ネットワーク(共振器ネットワーク)が提案された。
最近の研究はホップフィールドネットワークと拡散モデルの間に顕著な類似性を示している。
これらの観測により、拡散モデルにおける結合推論を用いた意味分解の枠組みを導入する。
提案手法は意味的分解を逆問題とし,因子推定の合成を促進させる再構成誘導項を用いて拡散過程を結合する。
また,本モデルの性能を向上する新しい反復サンプリング手法を提案する。
最後に、注意に基づく共振器ネットワークは、我々のフレームワークの特別なケースであることを示す。
実験により、結合推論フレームワークは、様々な合成意味論的分解タスクにおいて共振器ネットワークより優れていることを示す。
関連論文リスト
- Back-Projection Diffusion: Solving the Wideband Inverse Scattering Problem with Diffusion Models [2.717354728562311]
広帯域散乱データから逆散乱マップによって誘導される後部分布を近似する,エンドツーエンドの確率的フレームワークであるワイドバンドバックプロジェクション拡散を提案する。
この枠組みは高精度な再構成を行い、条件付き拡散モデルを利用してサンプルを描画し、波動伝播の基礎物理学の対称性を賞賛する。
論文 参考訳(メタデータ) (2024-08-05T23:33:24Z) - Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement [58.9768112704998]
遠方表現学習は、観測データ内の本質的要因を抽出する試みである。
我々は新しい視点と枠組みを導入し、クロスアテンションを持つ拡散モデルが強力な帰納バイアスとなることを示す。
これは、複雑な設計を必要とせず、クロスアテンションを持つ拡散モデルの強力な解離能力を明らかにする最初の研究である。
論文 参考訳(メタデータ) (2024-02-15T05:07:54Z) - Reduce, Reuse, Recycle: Compositional Generation with Energy-Based Diffusion Models and MCMC [102.64648158034568]
拡散モデルは、多くの領域において、生成モデリングの一般的なアプローチとなっている。
本稿では,新しい構成演算子の利用を可能にする拡散モデルのエネルギーベースパラメータ化を提案する。
これらのサンプルは、幅広い問題にまたがって構成生成の顕著な改善につながっている。
論文 参考訳(メタデータ) (2023-02-22T18:48:46Z) - Latent Network Embedding via Adversarial Auto-encoders [15.656374849760734]
本稿では,逆グラフ自動エンコーダに基づく潜在ネットワーク埋め込みモデルを提案する。
この枠組みの下では、潜伏構造を発見する問題は、部分的な観測から潜伏関係を推測するものとして定式化されている。
論文 参考訳(メタデータ) (2021-09-30T16:49:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。