論文の概要: General and Efficient Steering of Unconditional Diffusion
- arxiv url: http://arxiv.org/abs/2602.11395v1
- Date: Wed, 11 Feb 2026 21:58:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.553188
- Title: General and Efficient Steering of Unconditional Diffusion
- Title(参考訳): 非条件拡散の汎用的・効率的なステアリング
- Authors: Qingsong Wang, Mikhail Belkin, Yusu Wang,
- Abstract要約: 非条件拡散を効率的に操るレシピを提案する。
推測中は 勾配誘導なしで
本手法は拡散モデル構造に関する2つの観測に基づいて構築されている。
CIFAR-10、ImageNet、CelebAの実験では、精度/品質のオーバーベース勾配ガイダンスが改善された。
- 参考スコア(独自算出の注目度): 25.225845714398364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Guiding unconditional diffusion models typically requires either retraining with conditional inputs or per-step gradient computations (e.g., classifier-based guidance), both of which incur substantial computational overhead. We present a general recipe for efficiently steering unconditional diffusion {without gradient guidance during inference}, enabling fast controllable generation. Our approach is built on two observations about diffusion model structure: Noise Alignment: even in early, highly corrupted stages, coarse semantic steering is possible using a lightweight, offline-computed guidance signal, avoiding any per-step or per-sample gradients. Transferable concept vectors: a concept direction in activation space once learned transfers across both {timesteps} and {samples}; the same fixed steering vector learned near low noise level remains effective when injected at intermediate noise levels for every generation trajectory, providing refined conditional control with efficiency. Such concept directions can be efficiently and reliably identified via Recursive Feature Machine (RFM), a light-weight backpropagation-free feature learning method. Experiments on CIFAR-10, ImageNet, and CelebA demonstrate improved accuracy/quality over gradient-based guidance, while achieving significant inference speedups.
- Abstract(参考訳): 非条件拡散モデルを導くには、通常条件付き入力で再トレーニングするか、ステップごとの勾配計算(例えば、分類器に基づくガイダンス)を必要とする。
本稿では,非条件拡散を推論中の勾配誘導なしで効率的に操り,高速な制御可能な生成を可能にするための一般的なレシピを提案する。
ノイズアライメント:初期・高度に劣化した段階においても、粗いセマンティックステアリングは軽量でオフラインで計算された誘導信号を用いて可能であり、ステップごとの勾配やサンプルごとの勾配は避けることができる。
伝達可能な概念ベクトル: アクティベーション空間における概念方向は、一度、時間ステップとサンプルの両方の移動を学習し、低騒音レベル近くで学習したのと同じ固定ステアリングベクトルは、各世代軌跡の中間ノイズレベルに注入されたときに有効であり、洗練された条件制御を効率よく提供する。
このような概念の方向性は、軽量なバックプロパゲーションフリーな特徴学習法であるRecursive Feature Machine (RFM)によって効率よく確実に識別することができる。
CIFAR-10、ImageNet、CelebAの実験では、勾配に基づくガイダンスよりも精度と品質が向上し、推論速度が大幅に向上した。
関連論文リスト
- Path-Guided Flow Matching for Dataset Distillation [9.761850986508895]
本稿では, 数ステップでODEを解くことで, 高速な決定論的合成を可能にする, 生成蒸留のための最初のフローマッチングに基づくフレームワークを提案する。
本研究では, ODE-consistent path control のための連続経路-プロトタイプ誘導アルゴリズムを開発し, トラジェクトリが割り当てられたプロトタイプに確実に着地できるようにする。
論文 参考訳(メタデータ) (2026-02-05T12:52:32Z) - Spatial-Temporal Feedback Diffusion Guidance for Controlled Traffic Imputation [17.509468754018496]
空間的時間的交通データに欠落した値を付与することは、インテリジェント交通システムにとって不可欠である。
本研究では,インプット中の誘導尺度を適応的に制御する空間時間フィードバック拡散誘導法であるFENCEを提案する。
FENCEは、アテンションスコアに基づいてノードをグループ化することで、クラスタレベルでのガイダンススケールを計算する。
論文 参考訳(メタデータ) (2026-01-08T04:03:32Z) - TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling [53.61290359948953]
タンジェンシャル増幅誘導(TAG)は、下層の拡散モデルを変更することなく、軌道信号のみで動作する。
この誘導過程を1次テイラー展開を利用して定式化する。
TAGは、最小限の計算加算で拡散サンプリング忠実度を改善する、プラグアンドプレイのアーキテクチャに依存しないモジュールである。
論文 参考訳(メタデータ) (2025-10-06T06:53:29Z) - Discrete Guidance Matching: Exact Guidance for Discrete Flow Matching [36.348940136801296]
この問題に対処するために、離散データのための新しいガイダンスフレームワークを提案する。
学習した離散フローマッチングモデルにより、所望の分布の正確な遷移率を導出する。
本稿では,エネルギー誘導型シミュレーションと嗜好アライメントによるテキスト・ツー・イメージ生成とマルチモーダル理解タスクの有効性を示す。
論文 参考訳(メタデータ) (2025-09-26T05:51:31Z) - Noise-Level Diffusion Guidance: Well Begun is Half Done [9.745109820010601]
ノイズレベルガイダンス(NLG)は、単純で効率的で一般的なノイズレベル最適化手法である。
一般的な誘導との整合性を高めることにより、初期雑音を改善させる。
本手法は,拡散モデルに対する実用的でスケーラブルな拡張としてNLGを確立する。
論文 参考訳(メタデータ) (2025-09-17T13:05:59Z) - GrAInS: Gradient-based Attribution for Inference-Time Steering of LLMs and VLMs [56.93583799109029]
GrAInSは推論時ステアリングのアプローチで、言語のみのモデルと視覚言語の両方のモデルとタスクで動作する。
推論中、GrAInSはトークンレベルの属性信号によって誘導されるトランスフォーマー層で隠されたアクティベーションを隠蔽し、アクティベーションを正規化し、表現スケールを保存する。
微調整と既存のステアリングベースラインの両方を一貫して上回る。
論文 参考訳(メタデータ) (2025-07-24T02:34:13Z) - Diffusion-Sharpening: Fine-tuning Diffusion Models with Denoising Trajectory Sharpening [56.99266993852532]
拡散シャープニング(Diffusion-Sharpening)は、サンプリング軌道を最適化することで下流のアライメントを向上させる微調整手法である。
提案手法は, NFEを必要とせず, より高速に収束し, 最高の推論効率を示す。
論文 参考訳(メタデータ) (2025-02-17T18:57:26Z) - Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.49868273653921]
拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。
最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。
提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文 参考訳(メタデータ) (2024-08-01T17:59:59Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - Unsupervised Discovery of Interpretable Directions in h-space of
Pre-trained Diffusion Models [63.1637853118899]
本稿では,事前学習した拡散モデルのh空間における解釈可能な方向を特定するための,教師なしおよび学習に基づく最初の手法を提案する。
我々は、事前訓練された拡散モデルのh-スペースで動作するシフト制御モジュールを用いて、サンプルをシフトしたバージョンに操作する。
それらを共同で最適化することで、モデルは自然に絡み合った、解釈可能な方向を発見する。
論文 参考訳(メタデータ) (2023-10-15T18:44:30Z) - Observation-Guided Diffusion Probabilistic Models [41.749374023639156]
観測誘導拡散確率モデル(OGDM)と呼ばれる新しい拡散に基づく画像生成法を提案する。
本手法は,観測プロセスの指導をマルコフ連鎖と統合することにより,トレーニング目標を再構築する。
本研究では,強力な拡散モデルベースライン上での多様な推論手法を用いたトレーニングアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2023-10-06T06:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。