論文の概要: Temporal Concept Dynamics in Diffusion Models via Prompt-Conditioned Interventions
- arxiv url: http://arxiv.org/abs/2512.08486v1
- Date: Tue, 09 Dec 2025 11:05:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.931297
- Title: Temporal Concept Dynamics in Diffusion Models via Prompt-Conditioned Interventions
- Title(参考訳): プロンプト・コンディションを用いた拡散モデルにおける時間的概念ダイナミクス
- Authors: Ada Gorgun, Fawaz Sammani, Nikos Deligiannis, Bernt Schiele, Jonas Fischer,
- Abstract要約: PCIは、拡散時間を通して概念力学を解析するためのトレーニング不要でモデルに依存しないフレームワークである。
拡散モデルにまたがる様々な時間的挙動を明らかにしており、同じ概念タイプであっても、軌道の特定の位相は特定の概念に好適である。
- 参考スコア(独自算出の注目度): 70.87254264798341
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models are usually evaluated by their final outputs, gradually denoising random noise into meaningful images. Yet, generation unfolds along a trajectory, and analyzing this dynamic process is crucial for understanding how controllable, reliable, and predictable these models are in terms of their success/failure modes. In this work, we ask the question: when does noise turn into a specific concept (e.g., age) and lock in the denoising trajectory? We propose PCI (Prompt-Conditioned Intervention) to study this question. PCI is a training-free and model-agnostic framework for analyzing concept dynamics through diffusion time. The central idea is the analysis of Concept Insertion Success (CIS), defined as the probability that a concept inserted at a given timestep is preserved and reflected in the final image, offering a way to characterize the temporal dynamics of concept formation. Applied to several state-of-the-art text-to-image diffusion models and a broad taxonomy of concepts, PCI reveals diverse temporal behaviors across diffusion models, in which certain phases of the trajectory are more favorable to specific concepts even within the same concept type. These findings also provide actionable insights for text-driven image editing, highlighting when interventions are most effective without requiring access to model internals or training, and yielding quantitatively stronger edits that achieve a balance of semantic accuracy and content preservation than strong baselines. Code is available at: https://github.com/adagorgun/PCI-Prompt-Controlled-Interventions
- Abstract(参考訳): 拡散モデルは通常、最終的な出力によって評価され、次第にランダムノイズを意味のある画像に分解する。
しかし、生成は軌道に沿って展開し、この動的なプロセスを分析することは、これらのモデルがいかに制御可能で信頼性があり、予測可能かを、成功/失敗モードの観点から理解するために重要である。
音はいつ特定の概念(例えば、年齢)に変わるのか?
本稿では,PCI(Prompt-Conditioned Intervention)を提案する。
PCIは、拡散時間を通して概念力学を解析するためのトレーニング不要でモデルに依存しないフレームワークである。
中心となる考え方は、ある時点に挿入された概念が最終画像に保存され、反映される確率として定義された概念挿入成功(CIS)の分析であり、概念形成の時間的ダイナミクスを特徴づける方法を提供する。
いくつかの最先端のテキストと画像の拡散モデルと幅広い概念の分類に応用して、PCIは拡散モデルにまたがる多様な時間的挙動を明らかにし、同じ概念型であっても軌道の特定の位相が特定の概念に好適である。
これらの発見はまた、テキスト駆動画像編集のための実用的な洞察を提供し、介入がモデル内部へのアクセスやトレーニングを必要とせずに最も効果的である場合を強調し、強力なベースラインよりも意味的精度とコンテンツ保存のバランスを達成できる定量的に強力な編集をもたらす。
https://github.com/adagorgun/PCI-Prompt-Controlled-Interventions
関連論文リスト
- When, How Long and How Much? Interpretable Neural Networks for Time Series Regression by Learning to Mask and Aggregate [16.533105886716804]
時系列外部回帰(英: Time series extrinsic regression、TSER)とは、連続目標変数を入力時系列から予測するタスクである。
新しいアプローチは、アノテーションを必要とせずに、人間の理解可能な概念のコンパクトなセットを学ぶ。
論文 参考訳(メタデータ) (2025-12-03T09:01:41Z) - TRACE: Trajectory-Constrained Concept Erasure in Diffusion Models [0.0]
概念消去は、生成モデルにおいて特定の概念情報を削除または抑制することを目的としている。
Trajectory-Constrained Attentional Concept Erasure (TRACE) は拡散モデルから対象概念を消去する新しい手法である。
TRACEは最先端のパフォーマンスを実現し、ANT、EraseAnything、MACEといった最近の手法よりも、除去効率と出力品質の点で優れています。
論文 参考訳(メタデータ) (2025-05-29T10:15:22Z) - TRCE: Towards Reliable Malicious Concept Erasure in Text-to-Image Diffusion Models [53.937498564603054]
近年のテキスト・画像拡散モデルの進歩により、フォトリアリスティックな画像生成が可能になったが、NSFW画像のような悪意のあるコンテンツを生成するリスクもある。
リスクを軽減するため,概念消去手法が研究され,モデルが特定の概念を学習しやすくする。
本稿では,2段階のコンセプト消去戦略を用いて,信頼性の高い消去と知識保存の効果的なトレードオフを実現するTRCEを提案する。
論文 参考訳(メタデータ) (2025-03-10T14:37:53Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer [95.80384464922147]
ACDiTはブロックワイド条件拡散変換器である。
トークン単位の自己回帰とフルシーケンス拡散のフレキシブルな関係を提供する。
本稿では,映像生成タスクにおける自己回帰ベースラインの中で,ACDiTが最良であることを示す。
論文 参考訳(メタデータ) (2024-12-10T18:13:20Z) - How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? [91.49559116493414]
本稿では,CIDM(Concept-Incremental Text-to-image Diffusion Model)を提案する。
破滅的な忘れと概念の無視を解決し、新しいカスタマイズタスクを概念的な方法で学習する。
実験により、CIDMが既存のカスタム拡散モデルを上回ることが確認された。
論文 参考訳(メタデータ) (2024-10-23T06:47:29Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - TimeSHAP: Explaining Recurrent Models through Sequence Perturbations [3.1498833540989413]
リカレントニューラルネットワークは、多くの機械学習ドメインで標準的なビルディングブロックである。
これらのモデルにおける複雑な意思決定はブラックボックスと見なされ、正確性と解釈可能性の間の緊張を生み出す。
本研究では,モデルに依存しないリカレント説明器であるTimeSHAPを提示することにより,これらのギャップを埋めることに寄与する。
論文 参考訳(メタデータ) (2020-11-30T19:48:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。