論文の概要: Decoupled Classifier-Free Guidance for Counterfactual Diffusion Models
- arxiv url: http://arxiv.org/abs/2506.14399v1
- Date: Tue, 17 Jun 2025 10:56:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.435916
- Title: Decoupled Classifier-Free Guidance for Counterfactual Diffusion Models
- Title(参考訳): 相互拡散モデルのための非結合型分類器フリーガイダンス
- Authors: Tian Xia, Fabio De Sousa Ribeiro, Rajat R Rasal, Avinash Kori, Raghav Mehta, Ben Glocker,
- Abstract要約: Decoupled-Free Guidance(DCFG)は、グループワイドコンディショニング制御を導入したフレキシブルでモデルに依存しないフレームワークである。
DCFGは、セマンティックインプットをアンタングルする属性分割埋め込み戦略に基づいて構築されており、ユーザ定義の属性グループに対する選択的ガイダンスを可能にする。
CelebA-HQ、MIMIC-CXR、EMBEDの実験では、DCFGは介入の忠実度を改善し、意図しない変化を緩和し、可逆性を高める。
- 参考スコア(独自算出の注目度): 17.44485184010655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counterfactual image generation aims to simulate realistic visual outcomes under specific causal interventions. Diffusion models have recently emerged as a powerful tool for this task, combining DDIM inversion with conditional generation via classifier-free guidance (CFG). However, standard CFG applies a single global weight across all conditioning variables, which can lead to poor identity preservation and spurious attribute changes - a phenomenon known as attribute amplification. To address this, we propose Decoupled Classifier-Free Guidance (DCFG), a flexible and model-agnostic framework that introduces group-wise conditioning control. DCFG builds on an attribute-split embedding strategy that disentangles semantic inputs, enabling selective guidance on user-defined attribute groups. For counterfactual generation, we partition attributes into intervened and invariant sets based on a causal graph and apply distinct guidance to each. Experiments on CelebA-HQ, MIMIC-CXR, and EMBED show that DCFG improves intervention fidelity, mitigates unintended changes, and enhances reversibility, enabling more faithful and interpretable counterfactual image generation.
- Abstract(参考訳): 対物画像生成は、特定の因果的介入の下で現実的な視覚的成果をシミュレートすることを目的としている。
拡散モデルは近年,DDIMの逆変換と条件生成をCFG(classifier-free guidance)によって組み合わせた,このタスクの強力なツールとして登場した。
しかし、標準CFGは、全ての条件変数に対して単一のグローバルウェイトを適用しており、アイデンティティの保存が不十分で、属性の急激な変更につながる可能性がある。
そこで本研究では,グループワイドコンディショニング制御を導入したフレキシブルでモデルに依存しないフレームワークであるDecoupled Classifier-Free Guidance(DCFG)を提案する。
DCFGは、セマンティックインプットをアンタングルする属性分割埋め込み戦略に基づいて構築されており、ユーザ定義の属性グループに対する選択的ガイダンスを可能にする。
反ファクト生成のために、属性を因果グラフに基づいてインターベンションおよび不変集合に分割し、それぞれに異なるガイダンスを適用する。
CelebA-HQ、MIMIC-CXR、EMBEDの実験では、DCFGは介入の忠実さを改善し、意図しない変化を緩和し、可逆性を高め、より忠実で解釈可能な反事実画像生成を可能にする。
関連論文リスト
- Feedback Guidance of Diffusion Models [0.0]
Interval-Free Guidance (CFG) は, 条件付き拡散モデルにおける試料の忠実度向上の標準となっている。
本稿では,FBG(FeedBack Guidance)を提案する。
論文 参考訳(メタデータ) (2025-06-06T13:46:32Z) - Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Masking [15.052244821404079]
本稿では,モデルの予測信頼度を利用して非条件入力を調整する新しい手法であるAdaptive-Free Guidance (A-CFG)を紹介する。
A-CFGは、より効果的なガイダンスにつながる曖昧さの領域に焦点を当てている。
多様な言語生成ベンチマークの実験では、A-CFGは標準CFGよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-05-26T16:40:22Z) - Classifier-free Guidance with Adaptive Scaling [7.179513844921256]
フリーガイダンス(CFG)は、テキスト駆動拡散モデルにおいて必須のメカニズムである。
本稿では,世代誘導の影響を制御できる$beta$adaptive-CFGを提案する。
提案モデルでは,テキスト・ツー・イメージのCLIP類似度スコアを,参照CFGと類似したレベルに維持し,FIDスコアが向上した。
論文 参考訳(メタデータ) (2025-02-14T22:04:53Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Disentangled Contrastive Collaborative Filtering [36.400303346450514]
グラフコントラスト学習(GCL)は、監督ラベル不足問題に対処する上で、強力な性能を示した。
本稿では,自己監督型拡張による意図的ゆがみを実現するために,DCCF(Disentangled Contrasative Collaborative Filtering framework)を提案する。
我々のDCCFは、絡み合った自己超越信号からより微細な潜伏因子を蒸留できるだけでなく、増大による騒音を軽減することができる。
論文 参考訳(メタデータ) (2023-05-04T11:53:38Z) - Generative Model Based Noise Robust Training for Unsupervised Domain
Adaptation [108.11783463263328]
本稿では, 生成モデルに基づくノイズ・ロバスト訓練法(GeNRT)を提案する。
ラベルノイズを緩和しながらドメインシフトを除去する。
Office-Home、PACS、Digit-Fiveの実験は、GeNRTが最先端のメソッドに匹敵するパフォーマンスを実現していることを示している。
論文 参考訳(メタデータ) (2023-03-10T06:43:55Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。