論文の概要: FlowBender: Feedback-Aware Training for Self-Correcting Conditional Flows
- arxiv url: http://arxiv.org/abs/2606.20404v1
- Date: Thu, 18 Jun 2026 15:56:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.965657
- Title: FlowBender: Feedback-Aware Training for Self-Correcting Conditional Flows
- Title(参考訳): FlowBender: 自己補正型条件付き流れに対するフィードバック認識トレーニング
- Authors: Daniel Gilo, Sven Elflein, Ido Sobol, Or Litany,
- Abstract要約: FlowBenderは3D再構成のための新しい拡散流モデルである。
FlowBenderは、標準的な教師付きアライメントトレーニングよりも一貫して優れています。
微分可能な演算子に対して、FlowBenderのいくつかの変種を提案する。
- 参考スコア(独自算出の注目度): 18.746098727212544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditional diffusion and flow models routinely fail to satisfy the very constraints that define their task. For instance, a depth-conditioned model often produces images whose re-extracted depth disagrees with the input, even though the forward operator--the depth predictor defining the constraint--is available during both training and inference. Existing approaches generally fall into two categories: supervised models that treat the conditioning signal as a static cue and ignore alignment information at inference, and guidance-based methods that consult it through hand-tuned linear updates, typically trading fidelity to the condition against the plausibility of the generated sample. We argue that the fundamental gap in both paradigms is that the model is never trained to utilize its own alignment error. We introduce FlowBender, a closed-loop framework that treats this error as a first-class input, training the network to learn a correction policy conditioned on inference-time feedback. At each step, an unguided look-ahead pass estimates the clean signal, a task-specific deviation is computed via the forward operator, and a refinement pass consumes this signal to produce a corrected velocity. We propose several variants of FlowBender, including a gradient-based formulation for differentiable operators and a zero-order variant for non-differentiable settings such as JPEG compression. For efficient sampling, we introduce a prior-step shortcut that enables closed-loop correction at a minimal additional computational cost. Across image-to-image translation, restoration, and 3D mesh texturing, FlowBender consistently outperforms standard supervised baselines, alignment-loss-augmented training, and state-of-the-art inference-time guidance, improving fidelity and plausibility simultaneously rather than trading them against each other. Project page: https://flow-bender.github.io/
- Abstract(参考訳): 条件拡散とフローモデルは、通常、そのタスクを定義する制約を満たさない。
例えば、深度条件付きモデルは、フォワード演算子-制約を定義する深度予測器--がトレーニングと推論の両方で利用可能であっても、再抽出された深度が入力と一致しない画像を生成することが多い。
既存のアプローチは一般に2つのカテゴリに分類される: 条件信号を静的なキューとして扱い、推論時のアライメント情報を無視する教師付きモデルと、手動で調整された線形更新を通じてそれを参照するガイダンスベースの手法。
両パラダイムの根本的なギャップは、モデルが独自のアライメントエラーを利用するように訓練されていないことだ、と我々は主張する。
本稿では,このエラーを第一級入力として扱うクローズドループフレームワークであるFlowBenderを紹介する。
各ステップにおいて、未案内のルックアヘッドパスがクリーン信号を推定し、タスク固有の偏差をフォワード演算子を介して計算し、リファインメントパスがこの信号を消費して補正速度を生成する。
本稿では,微分可能な演算子に対する勾配に基づく定式化やJPEG圧縮などの非微分不可能な設定に対するゼロ階変式など,FlowBenderのいくつかの変種を提案する。
効率的なサンプリングを行うために,最小限の計算コストで閉ループ補正が可能な前処理ショートカットを導入する。
FlowBenderは画像から画像への変換、復元、および3Dメッシュのテクスチャ全体で、標準的な教師付きベースライン、アライメントロス強化トレーニング、最先端の推論ガイダンスを一貫して上回り、相互に取引するのではなく、忠実さと妥当性を同時に向上する。
プロジェクトページ: https://flow-bender.github.io/
関連論文リスト
- Follow the Mean: Reference-Guided Flow Matching [10.73543578064991]
フローマッチングは異なる制御インターフェース(例による適応)を持つことを示す。
決定論的補間子の場合、速度場は条件付き終端平均によってのみ支配される。
これは制御可能な生成の単純な原理である:従う参照集合を変更して事前訓練されたモデルを操る。
論文 参考訳(メタデータ) (2026-05-11T09:57:34Z) - General and Efficient Steering of Unconditional Diffusion [25.225845714398364]
非条件拡散を効率的に操るレシピを提案する。
推測中は 勾配誘導なしで
本手法は拡散モデル構造に関する2つの観測に基づいて構築されている。
CIFAR-10、ImageNet、CelebAの実験では、精度/品質のオーバーベース勾配ガイダンスが改善された。
論文 参考訳(メタデータ) (2026-02-11T21:58:26Z) - From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model [72.73512218682187]
ReDiff(Refining-enhanced diffusion framework)は、モデルに自身のエラーを特定し、修正するように教えるフレームワークである。
まず、合成エラーを修正するためにモデルをトレーニングすることで、基礎的なリビジョン機能を具現化し、次に、新しいオンライン自己補正ループを実装します。
この誤り駆動学習は、モデルに既存の出力を再検討し、洗練する重要な能力を与え、エラーカスケードを効果的に破壊する。
論文 参考訳(メタデータ) (2025-10-22T06:58:55Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow [65.51671121528858]
拡散モデルは、視覚生成を大幅に改善したが、生成ODEを解くという計算集約的な性質のため、生成速度の遅さによって妨げられている。
広く認識されている解である整流流は、ODEパスを直線化することで生成速度を向上させる。
本稿では,より広範な拡散モデルのカテゴリをカバーするために,設計空間と修正の応用範囲を一般化するRectified Diffusionを提案する。
論文 参考訳(メタデータ) (2024-10-09T17:43:38Z) - DR-Tune: Improving Fine-tuning of Pretrained Visual Models by
Distribution Regularization with Semantic Calibration [38.4461170690033]
セマンティックキャリブレーションを用いた分布正規化(DR-Tune)という,新しい微調整フレームワークを提案する。
DR-Tuneは、下流タスクヘッドを強制して、事前訓練された特徴分布の分類誤差を低減することで、分散正則化を採用する。
セマンティックドリフトによる干渉を軽減するため,セマンティックキャリブレーション(SC)モジュールを開発した。
論文 参考訳(メタデータ) (2023-08-23T10:59:20Z) - DistractFlow: Improving Optical Flow Estimation via Realistic
Distractions and Pseudo-Labeling [49.46842536813477]
本稿では,光フロー推定モデルのトレーニングのための新しいデータ拡張手法であるDistractFlowを提案する。
2つのフレームのうちの1つを、類似したドメインを描写したイントラクタイメージと組み合わせることで、自然の物体やシーンと相反する視覚的摂動を誘発することができる。
私たちのアプローチでは、追加のアノテーションを必要とせずに、利用可能なトレーニングペアの数を大幅に増やすことができます。
論文 参考訳(メタデータ) (2023-03-24T15:42:54Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。