論文の概要: Error as Signal: Stiffness-Aware Diffusion Sampling via Embedded Runge-Kutta Guidance
- arxiv url: http://arxiv.org/abs/2603.03692v1
- Date: Wed, 04 Mar 2026 03:37:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.172798
- Title: Error as Signal: Stiffness-Aware Diffusion Sampling via Embedded Runge-Kutta Guidance
- Title(参考訳): 信号としての誤り: 埋め込みルンゲ・クッタ誘導による剛性認識拡散サンプリング
- Authors: Inho Kong, Sojin Lee, Youngjoon Hong, Hyunwoo J. Kim,
- Abstract要約: 硬い地域ではODE軌道が急激に変化し、そこでは局所的乱れ誤差(LTE)が試料の品質を低下させる重要な要因となる。
本研究では,検出剛性を利用してLTEの低減とサンプリングの安定化を図るEmbeded Runge-Kutta Guidance (ERKGuid)を提案する。
合成データセットと一般的なベンチマークデータセットであるImageNetに関する実験は、ERKGuidが常に最先端の手法より優れていることを示した。
- 参考スコア(独自算出の注目度): 35.84939959436188
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifier-Free Guidance (CFG) has established the foundation for guidance mechanisms in diffusion models, showing that well-designed guidance proxies significantly improve conditional generation and sample quality. Autoguidance (AG) has extended this idea, but it relies on an auxiliary network and leaves solver-induced errors unaddressed. In stiff regions, the ODE trajectory changes sharply, where local truncation error (LTE) becomes a critical factor that deteriorates sample quality. Our key observation is that these errors align with the dominant eigenvector, motivating us to leverage the solver-induced error as a guidance signal. We propose Embedded Runge-Kutta Guidance (ERK-Guid), which exploits detected stiffness to reduce LTE and stabilize sampling. We theoretically and empirically analyze stiffness and eigenvector estimators with solver errors to motivate the design of ERK-Guid. Our experiments on both synthetic datasets and the popular benchmark dataset, ImageNet, demonstrate that ERK-Guid consistently outperforms state-of-the-art methods. Code is available at https://github.com/mlvlab/ERK-Guid.
- Abstract(参考訳): 分類自由誘導(CFG)は拡散モデルにおける誘導機構の基礎を確立しており、よく設計された誘導プロキシは条件生成とサンプル品質を著しく改善することを示している。
Autoguidance (AG)は、このアイデアを拡張したが、補助的なネットワークに依存し、解決者によるエラーを未修正のまま残している。
硬い地域ではODE軌道が急激に変化し、そこでは局所的乱れ誤差(LTE)が試料の品質を低下させる重要な要因となる。
我々のキーとなる観察は、これらの誤差が支配的な固有ベクトルと一致し、誘導信号としてソルバによる誤差を利用する動機となることである。
本研究では,検出剛性を利用してLTEの低減とサンプリングの安定化を図るEmbeded Runge-Kutta Guidance (ERK-Guid)を提案する。
我々は,ERK-Guidの設計を動機付けるために,ソルバ誤差を用いた剛性と固有ベクトル推定器を理論的かつ実験的に解析した。
合成データセットと一般的なベンチマークデータセットであるImageNetに関する実験は、ERK-Guidが常に最先端の手法より優れていることを示した。
コードはhttps://github.com/mlvlab/ERK-Guid.comで入手できる。
関連論文リスト
- Toward the Frontiers of Reliable Diffusion Sampling via Adversarial Sinkhorn Attention Guidance [8.46069844016289]
Adversarial Sinkhorn Attention Guidance (ASAG) は、最適な輸送のレンズを通して拡散モデルの注意点を再解釈する新しい手法である。
注意機構を損なう代わりに、ASAGは、クエリとキー間のピクセル単位の類似性を減少させるために、自己注意層内に対向コストを注入する。
ASAGは、テキストと画像の拡散における一貫した改善を示し、IP-AdapterやControlNetといった下流アプリケーションにおける制御性と忠実性を高める。
論文 参考訳(メタデータ) (2025-11-10T15:52:53Z) - SteeringTTA: Guiding Diffusion Trajectories for Robust Test-Time-Adaptation [10.159672026403097]
テスト時間適応(TTA)は、未ラベルのテストデータを用いてモデルや入力を更新することにより、分散シフト下でのディープモデルの性能劣化を補正することを目的としている。
本稿では,Fynman-Kac ステアリングを応用し,擬似ラベルによる報酬付き分類のための拡散型入力適応を導出する推論専用フレームワークである SteeringTTA を提案する。
論文 参考訳(メタデータ) (2025-10-16T12:46:53Z) - TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling [53.61290359948953]
タンジェンシャル増幅誘導(TAG)は、下層の拡散モデルを変更することなく、軌道信号のみで動作する。
この誘導過程を1次テイラー展開を利用して定式化する。
TAGは、最小限の計算加算で拡散サンプリング忠実度を改善する、プラグアンドプレイのアーキテクチャに依存しないモジュールである。
論文 参考訳(メタデータ) (2025-10-06T06:53:29Z) - FreeGAD: A Training-Free yet Effective Approach for Graph Anomaly Detection [54.576802512108685]
Graph Anomaly Detection (GAD)は、グラフ内の多数から逸脱するノードを特定することを目的としている。
既存のアプローチは、複雑でリソース集約的なトレーニングプロセスのために、高デプロイメントコストとスケーラビリティの不足に悩まされることが多い。
新たなGAD法であるFreeGADを提案する。
論文 参考訳(メタデータ) (2025-08-14T12:37:20Z) - RAAG: Ratio Aware Adaptive Guidance [9.525432706814675]
フローベースの生成モデルは驚くべき進歩を遂げた。
推論全体を通じて強力な、固定されたガイダンススケールを適用することは、現代的なアプリケーションに必要な、迅速な、数ステップのサンプリングには適していない。
本稿では,進化率に基づいて早期段階の指導尺度を自動的に減衰させる,シンプルな,理論的に基礎付けられた適応型指導スケジュールを提案する。
論文 参考訳(メタデータ) (2025-08-05T13:41:05Z) - Feedback Guidance of Diffusion Models [14.162420300295365]
Interval-Free Guidance (CFG) は, 条件付き拡散モデルにおける試料の忠実度向上の標準となっている。
本稿では,FBG(FeedBack Guidance)を提案する。
論文 参考訳(メタデータ) (2025-06-06T13:46:32Z) - Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - Typicalness-Aware Learning for Failure Detection [26.23185979968123]
ディープニューラルネットワーク(DNN)は、しばしば自信過剰な問題に悩まされる。
そこで本研究では,本問題に対処し,故障検出性能を向上させるために,S typicalness-Aware Learning (TAL) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-04T11:09:47Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - Unbiased Risk Estimators Can Mislead: A Case Study of Learning with
Complementary Labels [92.98756432746482]
我々は,補完ラベルを用いた学習という,弱教師付き問題を研究する。
勾配推定の品質はリスク最小化においてより重要であることを示す。
本稿では,ゼロバイアスと分散の低減を両立させる新しい補助的相補的損失(SCL)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-05T04:19:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。