論文の概要: Coupled Inference in Diffusion Models for Semantic Decomposition
- arxiv url: http://arxiv.org/abs/2602.09983v1
- Date: Tue, 10 Feb 2026 17:10:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.696349
- Title: Coupled Inference in Diffusion Models for Semantic Decomposition
- Title(参考訳): 意味的分解のための拡散モデルにおける結合推論
- Authors: Calvin Yeung, Ali Zakeri, Zhuowen Zou, Mohsen Imani,
- Abstract要約: 拡散モデルにおける結合推論を用いた意味分解のためのフレームワークを提案する。
提案手法は, 合成意味分解タスクの多岐にわたる共振器ネットワークより優れていることを示す。
- 参考スコア(独自算出の注目度): 9.847716738789392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many visual scenes can be described as compositions of latent factors. Effective recognition, reasoning, and editing often require not only forming such compositional representations, but also solving the decomposition problem. One popular choice for constructing these representations is through the binding operation. Resonator networks, which can be understood as coupled Hopfield networks, were proposed as a way to perform decomposition on such bound representations. Recent works have shown notable similarities between Hopfield networks and diffusion models. Motivated by these observations, we introduce a framework for semantic decomposition using coupled inference in diffusion models. Our method frames semantic decomposition as an inverse problem and couples the diffusion processes using a reconstruction-driven guidance term that encourages the composition of factor estimates to match the bound vector. We also introduce a novel iterative sampling scheme that improves the performance of our model. Finally, we show that attention-based resonator networks are a special case of our framework. Empirically, we demonstrate that our coupled inference framework outperforms resonator networks across a range of synthetic semantic decomposition tasks.
- Abstract(参考訳): 多くの視覚シーンは、潜伏因子の合成として記述できる。
効果的な認識、推論、編集は、しばしばそのような構成表現を形成するだけでなく、分解問題を解く必要がある。
これらの表現を構築するための一般的な選択は、バインディング操作である。
このような有界表現の分解を行う手段として,共振器ネットワーク(共振器ネットワーク)が提案された。
最近の研究はホップフィールドネットワークと拡散モデルの間に顕著な類似性を示している。
これらの観測により、拡散モデルにおける結合推論を用いた意味分解の枠組みを導入する。
提案手法は意味的分解を逆問題とし,因子推定の合成を促進させる再構成誘導項を用いて拡散過程を結合する。
また,本モデルの性能を向上する新しい反復サンプリング手法を提案する。
最後に、注意に基づく共振器ネットワークは、我々のフレームワークの特別なケースであることを示す。
実験により、結合推論フレームワークは、様々な合成意味論的分解タスクにおいて共振器ネットワークより優れていることを示す。
関連論文リスト
- AutoBayes: A Compositional Framework for Generalized Variational Inference [0.0]
一般化された変分推論のための新しい構成フレームワークを提案する。
本稿では, 逆モード自動微分と同様の連鎖則を, 偏差推論に典型的なベイズ推定と損失関数が満足することを示す。
論文 参考訳(メタデータ) (2025-03-24T12:05:45Z) - Back-Projection Diffusion: Solving the Wideband Inverse Scattering Problem with Diffusion Models [2.717354728562311]
広帯域散乱データから逆散乱マップによって誘導される後部分布を近似する,エンドツーエンドの確率的フレームワークであるワイドバンドバックプロジェクション拡散を提案する。
この枠組みは高精度な再構成を行い、条件付き拡散モデルを利用してサンプルを描画し、波動伝播の基礎物理学の対称性を賞賛する。
論文 参考訳(メタデータ) (2024-08-05T23:33:24Z) - Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement [58.9768112704998]
遠方表現学習は、観測データ内の本質的要因を抽出する試みである。
我々は新しい視点と枠組みを導入し、クロスアテンションを持つ拡散モデルが強力な帰納バイアスとなることを示す。
これは、複雑な設計を必要とせず、クロスアテンションを持つ拡散モデルの強力な解離能力を明らかにする最初の研究である。
論文 参考訳(メタデータ) (2024-02-15T05:07:54Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Reduce, Reuse, Recycle: Compositional Generation with Energy-Based Diffusion Models and MCMC [102.64648158034568]
拡散モデルは、多くの領域において、生成モデリングの一般的なアプローチとなっている。
本稿では,新しい構成演算子の利用を可能にする拡散モデルのエネルギーベースパラメータ化を提案する。
これらのサンプルは、幅広い問題にまたがって構成生成の顕著な改善につながっている。
論文 参考訳(メタデータ) (2023-02-22T18:48:46Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Latent Network Embedding via Adversarial Auto-encoders [15.656374849760734]
本稿では,逆グラフ自動エンコーダに基づく潜在ネットワーク埋め込みモデルを提案する。
この枠組みの下では、潜伏構造を発見する問題は、部分的な観測から潜伏関係を推測するものとして定式化されている。
論文 参考訳(メタデータ) (2021-09-30T16:49:46Z) - Image Synthesis via Semantic Composition [74.68191130898805]
本稿では,その意味的レイアウトに基づいて現実的なイメージを合成する新しい手法を提案する。
類似した外観を持つ物体に対して、類似した表現を共有するという仮説が立てられている。
本手法は, 空間的変化と関連表現の両方を生じる, 外観相関による領域間の依存関係を確立する。
論文 参考訳(メタデータ) (2021-09-15T02:26:07Z) - Better Set Representations For Relational Reasoning [30.398348643632445]
リレーショナル推論は、標準的なベクトル表現とは対照的に、エンティティのセットで動作する。
本稿では,SRN(Set Refiner Network)と呼ばれるシンプルで汎用的なネットワークモジュールを提案する。
論文 参考訳(メタデータ) (2020-03-09T23:07:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。