論文の概要: In-situ Autoguidance: Eliciting Self-Correction in Diffusion Models
- arxiv url: http://arxiv.org/abs/2510.17136v1
- Date: Mon, 20 Oct 2025 04:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.29912
- Title: In-situ Autoguidance: Eliciting Self-Correction in Diffusion Models
- Title(参考訳): In-situ Autoguidance:拡散モデルにおける自己補正の回避
- Authors: Enhao Gu, Haolin Hou,
- Abstract要約: In-situ Autoguidanceは補助的なコンポーネントなしでモデル自体からガイダンスを提供する。
このゼロコストアプローチが実現可能であるだけでなく、コスト効率向上のための強力なベースラインを確立することを実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The generation of high-quality, diverse, and prompt-aligned images is a central goal in image-generating diffusion models. The popular classifier-free guidance (CFG) approach improves quality and alignment at the cost of reduced variation, creating an inherent entanglement of these effects. Recent work has successfully disentangled these properties by guiding a model with a separately trained, inferior counterpart; however, this solution introduces the considerable overhead of requiring an auxiliary model. We challenge this prerequisite by introducing In-situ Autoguidance, a method that elicits guidance from the model itself without any auxiliary components. Our approach dynamically generates an inferior prediction on the fly using a stochastic forward pass, reframing guidance as a form of inference-time self-correction. We demonstrate that this zero-cost approach is not only viable but also establishes a powerful new baseline for cost-efficient guidance, proving that the benefits of self-guidance can be achieved without external models.
- Abstract(参考訳): 画像生成拡散モデルにおいて、高品質で多彩で即列な画像の生成が中心的な目標である。
一般的な分類器フリーガイダンス (CFG) アプローチは、変化を減少させるコストで品質とアライメントを改善し、これらの効果の固有の絡み合いを生み出す。
最近の研究は、個別に訓練された劣等なモデルでモデルを導くことで、これらの特性を混乱させることに成功したが、この解決策は補助モデルを必要とするかなりのオーバーヘッドをもたらす。
In-situ Autoguidanceは、補助的なコンポーネントを使わずにモデル自体からガイダンスを引き出す手法である。
提案手法は, 確率的前方通過を用いたハエの逆予測を動的に生成し, 推論時間自己補正の一形態として誘導する。
我々は、このゼロコストアプローチが実現可能であるだけでなく、コスト効率の高いガイダンスのための強力な新しいベースラインを確立し、外部モデルなしで自己指導の利点を達成できることを実証した。
関連論文リスト
- Steering Guidance for Personalized Text-to-Image Diffusion Models [19.550718192994353]
既存のサンプリングガイダンス手法では、出力をバランスの取れた空間へ誘導することができない。
我々は、ヌルテキストプロンプトに条件付き未学習弱モデルを活用する、単純で効果的なパーソナライズガイダンスを提案する。
本手法は,余分な計算オーバーヘッドを伴わずに,バランスの取れた潜在空間への出力を明示的に制御する。
論文 参考訳(メタデータ) (2025-08-01T05:02:26Z) - How Much To Guide: Revisiting Adaptive Guidance in Classifier-Free Guidance Text-to-Vision Diffusion Models [57.42800112251644]
我々は、シンプルで普遍的な適応型ガイダンス戦略であるStep AGを提案する。
評価は画像品質と画像テキストアライメントの両方に焦点をあてる。
論文 参考訳(メタデータ) (2025-06-10T02:09:48Z) - Self-NPO: Negative Preference Optimization of Diffusion Models by Simply Learning from Itself without Explicit Preference Annotations [60.143658714894336]
拡散モデルは、画像、ビデオ、および3Dコンテンツ生成を含む様々な視覚生成タスクにおいて顕著な成功を収めている。
優先度最適化(PO)は、これらのモデルを人間の嗜好に合わせることを目的とした、顕著で成長している研究分野である。
モデル自体からのみ学習する負の選好最適化アプローチであるSelf-NPOを導入する。
論文 参考訳(メタデータ) (2025-05-17T01:03:46Z) - Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion Model [62.11981915549919]
ドメインガイダンス(Domain Guidance)は、トレーニング済みの知識を活用して、サンプリングプロセスを対象のドメインに誘導する移行アプローチである。
FIDは19.6%改善し、FD$_textDINOv2$は23.4%改善した。
論文 参考訳(メタデータ) (2025-04-02T09:07:55Z) - Self-Improvement in Language Models: The Sharpening Mechanism [70.9248553790022]
我々は、レンズを通して自己改善の能力について、新たな視点を提供する。
言語モデルは、正しい応答を生成する場合よりも、応答品質の検証が優れているという観察に感銘を受けて、後学習において、モデル自体を検証対象として、自己改善を形式化する。
SFTとRLHFに基づく自己改善アルゴリズムの2つの自然ファミリーを解析する。
論文 参考訳(メタデータ) (2024-12-02T20:24:17Z) - Guiding a diffusion model using sliding windows [0.9402985123717579]
本稿では,新しいトレーニングフリー手法であるEmphmasked Slideing window Guide (M-SWG)を紹介する。
M-SWGは、その受容場を選択的に制限することで、一次モデルをそれ自体で導くことによって、長距離空間依存性を増大させる。
M-SWGは、従来の最先端のトレーニングフリーアプローチと比較して、優れたインセプションスコア(IS)を達成している。
論文 参考訳(メタデータ) (2024-11-15T15:04:04Z) - Studying How to Efficiently and Effectively Guide Models with Explanations [52.498055901649025]
「モデルガイダンス」とは「正しい理由のために正しい」ことを保証するためにモデルの説明を規則化する考え方である。
PASCAL VOC 2007 および MS COCO 2014 データセット上で, 各種損失関数, 帰属方法, モデル, 誘導深度について詳細な評価を行う。
具体的には、一般的に使用されるセグメンテーションマスクよりもはるかに安価で入手可能なバウンディングボックスアノテーションを用いてモデルをガイドする。
論文 参考訳(メタデータ) (2023-03-21T15:34:50Z) - Your Autoregressive Generative Model Can be Better If You Treat It as an
Energy-Based One [83.5162421521224]
本稿では,自己回帰生成モデルの学習のための独自のE-ARM法を提案する。
E-ARMは、よく設計されたエネルギーベースの学習目標を活用する。
我々は、E-ARMを効率的に訓練でき、露光バイアス問題を緩和できることを示した。
論文 参考訳(メタデータ) (2022-06-26T10:58:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。