論文の概要: DCR: Counterfactual Attractor Guidance for Rare Compositional Generation
- arxiv url: http://arxiv.org/abs/2605.06512v1
- Date: Thu, 07 May 2026 16:22:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.992356
- Title: DCR: Counterfactual Attractor Guidance for Rare Compositional Generation
- Title(参考訳): DCR:レアコンポジション生成のための非現実的トラクター誘導
- Authors: Taewon Kang, Matthias Zwicker,
- Abstract要約: Default Completion Repulsion (DCR)は、トレーニング不要のフレームワークで、デフォルトの完了動作を明示的にモデル化し、抑制する。
DCRは、リトレーニングやアーキテクチャの変更なしに、標準拡散サンプリングプロセス内で完全に動作する。
- 参考スコア(独自算出の注目度): 12.791968394241438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models generate realistic visual content, yet often fail to produce rare but plausible compositions. When prompted with combinations that are valid but underrepresented in training data, such as a snowy beach or a rainbow at night, the generation process frequently collapses toward more common alternatives. We identify this failure mode as default completion bias, where denoising trajectories are implicitly attracted toward high-frequency semantic configurations. Existing guidance mechanisms do not explicitly model this competing tendency and therefore struggle to prevent such collapse. We introduce Default Completion Repulsion (DCR), a training-free framework that explicitly models and suppresses default completion behavior. DCR constructs a counterfactual attractor by relaxing the rare compositional factor while preserving surrounding semantics, inducing an alternative denoising trajectory reflecting the model's preferred completion. We define the discrepancy between target and attractor trajectories as a counterfactual drift, and propose a projection-based repulsion mechanism that removes guidance components aligned with this drift direction. This suppresses undesired frequent completions while preserving other semantic components. DCR operates entirely within the standard diffusion sampling process without retraining or architectural modification. Experiments on rare compositional prompts show that DCR improves compositional fidelity while maintaining visual quality. Our analysis further shows that the framework exposes and counteracts intrinsic model biases, offering a new perspective on controllable generation beyond explicit constraint enforcement.
- Abstract(参考訳): 拡散モデルは現実的な視覚的内容を生成するが、しばしば稀だがもっともらしい構成を生成する。
雪浜や夜間の虹など、訓練データでは有効ではないが表現が不十分な組み合わせによって誘導されると、生成プロセスはより一般的な代替手段に向けてしばしば崩壊する。
我々は、この障害モードをデフォルトの完了バイアスとみなし、そこでは軌跡を暗黙的に高周波セマンティック構成に惹きつける。
既存の誘導メカニズムは、この競合する傾向を明示的にモデル化していないため、そのような崩壊を防ぐのに苦労している。
DCR(Deefault Completion Repulsion)は、トレーニング不要なフレームワークで、デフォルトの完了動作を明示的にモデル化し、抑制する。
DCRは、周囲のセマンティクスを保ちながら稀な構成因子を緩和し、モデルが好む完成を反映する代替の認知軌道を誘導することによって、反ファクトファクトファインダを構築する。
本研究では,目標軌道とトラジェクタ軌道の差を対物ドリフトとして定義し,このドリフト方向に沿った誘導成分を除去するプロジェクションベース反発機構を提案する。
これにより、望ましくない頻繁な補完が抑制され、他のセマンティックコンポーネントが保存される。
DCRは、リトレーニングやアーキテクチャの変更なしに、標準拡散サンプリングプロセス内で完全に動作する。
稀な構成的プロンプトの実験では、DCRは視覚的品質を維持しながら、構成的忠実性を改善することが示されている。
我々の分析は、このフレームワークが本質的なモデルバイアスを露呈し、対処し、明示的な制約執行を超えた制御可能な生成の新しい視点を提供することを示している。
関連論文リスト
- Continuous-Time Distribution Matching for Few-Step Diffusion Distillation [57.28746398500951]
本稿では,CDM(Continuous-Time Distribution Matching)を導入し,DMDフレームワークを個別アンカーから連続最適化へ移行する。
まず、固定離散スケジュールをランダム長の動的連続スケジュールに置き換える。
第二に、学生の速度場を介して外挿された潜伏者に対してアクティブな軌道外マッチングを行う連続時間アライメント目的を提案する。
論文 参考訳(メタデータ) (2026-05-07T14:56:39Z) - Bridging Restoration and Generation Manifolds in One-Step Diffusion for Real-World Super-Resolution [22.963799508399365]
最近の単一段階蒸留は推論を加速するが、認識歪んだトレードオフに直面している。
実時間ISR(IDaS-SR)の適応的インバージョンと劣化認識サンプリングを提案する。
IDaS-SRは決定論的復元と生成のボトルネックを埋める一段階のフレームワークである。
論文 参考訳(メタデータ) (2026-04-27T07:43:00Z) - Allo{SR}$^2$: Rectifying One-Step Super-Resolution to Stay Real via Allomorphic Generative Flows [32.29950358173077]
大規模拡散モデルとフローベースモデルの強力な生成先行モデルを活用することで、実世界の超解像(Real-SR)が革新された。
AlloSR$2$は、高忠実な生成リアリズムを維持するために同型生成フローを介して一段階のSR軌道を補正する新しいフレームワークである。
論文 参考訳(メタデータ) (2026-04-21T08:44:40Z) - Beyond Reconstruction: Reconstruction-to-Vector Diffusion for Hyperspectral Anomaly Detection [9.078979356836193]
ハイパースペクトル異常検出(HAD)は、複雑なシーンにおけるスパースターゲットの同定に優れる。
既存のモデルは、スカラー・アズ・ア・エンドポイント(reconstruction-as-endpoint)パラダイムに閉じ込められているままである。
本稿では, 精製源として再構成を再定義するリコンストラクション・トゥ・ディフュージョン(R2VD)を提案する。
R2VDは新たな最先端技術を確立し、例外的な目標検出のバックグラウンドを提供する。
論文 参考訳(メタデータ) (2026-04-13T12:31:50Z) - Diffusion Reinforcement Learning via Centered Reward Distillation [35.979608265594685]
フォワードプロセス微細チューニング上に構築されたKL正規化報酬モデルから導出した拡散RLフレームワークである textbf Reward Distillation (CRD) を提案する。
信頼性の高いテキスト・画像の微調整を可能にするため,分布のドリフトを明示的に制御する手法を提案する。
textttGenEval と textttOCR rewards によるテキスト・ツー・イメージのポストトレーニング実験では、競合する SOTA の報酬最適化が高速収束と報酬ハッキングの好みの低減をもたらすことが示された。
論文 参考訳(メタデータ) (2026-03-14T21:29:33Z) - On the Collapse of Generative Paths: A Criterion and Correction for Diffusion Steering [29.633206995806542]
インタイムステアリングにより、事前トレーニングされた拡散/フローモデルを、再トレーニングせずに新しいタスクに適合させることができる。
この構造には批判的かつ以前は形式化されていなかった障害モード(Marginal Path Collapse)がある。
本稿では,Feynman-Kac ステアリングを時間変化指数に拡張する Adaptive path Correction with Exponents (ACE) を提案する。
論文 参考訳(メタデータ) (2025-12-11T06:44:08Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Generative Model Inversion Through the Lens of the Manifold Hypothesis [98.37040155914595]
モデル反転攻撃(MIA)は、訓練されたモデルからクラス表現型サンプルを再構成することを目的としている。
最近の生成的MIAは、生成的敵ネットワークを使用して、反転過程を導く画像の事前学習を行う。
論文 参考訳(メタデータ) (2025-09-24T14:39:25Z) - Restoration Score Distillation: From Corrupted Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
Score Distillation (DSD) の原理的一般化である textitRestoration Score Distillation (RSD) を提案する。
RSDは、ぼやけた画像、不完全画像、低解像度画像など、広範囲の汚職タイプに対応している。
自然と科学の両方のデータセットの様々な復元作業において、教師モデルを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-19T17:21:03Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。