論文の概要: FlowSteer: Conditioning Flow Field for Consistent Image Restoration
- arxiv url: http://arxiv.org/abs/2512.08125v1
- Date: Tue, 09 Dec 2025 00:09:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.762645
- Title: FlowSteer: Conditioning Flow Field for Consistent Image Restoration
- Title(参考訳): FlowSteer: 一貫性画像復元のためのコンディショニングフロー場
- Authors: Tharindu Wickremasinghe, Chenyang Qi, Harshana Weligampola, Zhengzhong Tu, Stanley H. Chan,
- Abstract要約: フローベーステキスト・トゥ・イメージ(T2I)モデルは、プロンプト駆動画像生成において優れるが、画像復元(IR)に重きを置いている。
本稿では,サンプリング経路に沿って測定先を注入する演算子対応コンディショニングスキームであるFlowSteer(FS)を紹介する。
FSは、厳密なゼロショット設定なしのリトレーニングされたモデルで、アダプタなしで測定一貫性とアイデンティティの保存を改善する。
- 参考スコア(独自算出の注目度): 29.10704687691786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Flow-based text-to-image (T2I) models excel at prompt-driven image generation, but falter on Image Restoration (IR), often "drifting away" from being faithful to the measurement. Prior work mitigate this drift with data-specific flows or task-specific adapters that are computationally heavy and not scalable across tasks. This raises the question "Can't we efficiently manipulate the existing generative capabilities of a flow model?" To this end, we introduce FlowSteer (FS), an operator-aware conditioning scheme that injects measurement priors along the sampling path,coupling a frozed flow's implicit guidance with explicit measurement constraints. Across super-resolution, deblurring, denoising, and colorization, FS improves measurement consistency and identity preservation in a strictly zero-shot setting-no retrained models, no adapters. We show how the nature of flow models and their sensitivities to noise inform the design of such a scheduler. FlowSteer, although simple, achieves a higher fidelity of reconstructed images, while leveraging the rich generative priors of flow models.
- Abstract(参考訳): フローベースのテキスト・トゥ・イメージ(T2I)モデルは、プロンプト駆動の画像生成において優れているが、画像復元(IR)では、しばしば計測に忠実であることから「遠ざかる」。
以前の作業では、この流れをデータ固有のフローやタスク固有のアダプタで軽減しています。
フローモデルの既存の生成能力を効率的に操作しないのか?
この目的のために,フローの暗黙的なガイダンスと明示的な測定制約を結合して,サンプリング経路に沿って測定先行値を注入する演算子対応条件付スキームであるFlowSteer(FS)を導入する。
FSは超高解像度、デブロアリング、デノイング、カラー化の他、厳密なゼロショット設定なしリトレーニングされたモデルにおいて、アダプタなしで測定一貫性とアイデンティティの保存を改善している。
本研究では,このようなスケジューラの設計について,フローモデルの性質とノイズに対する感性について述べる。
FlowSteerは単純ではあるが、再構成された画像の忠実度を高めながら、フローモデルの豊かな生成先を生かしている。
関連論文リスト
- Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - Steering Rectified Flow Models in the Vector Field for Controlled Image Generation [53.965218831845995]
拡散モデル(DM)は、フォトリアリズム、画像編集、逆問題解決に優れ、分類器なしのガイダンスと画像反転技術によって支援される。
既存のDMベースの手法は、しばしば追加のトレーニングを必要とし、事前訓練された潜在モデルへの一般化が欠如し、ODEソルバと反転プロセスによる広範なバックプロパゲーションにより、計算資源が要求される。
本研究では,ベクトル場を利用した画像生成タスクのデノイング軌道の制御を行うFlowChefを提案する。
FlowChefは、パフォーマンス、メモリ、時間要件の点でベースラインを大幅に上回り、新しい状態を達成する。
論文 参考訳(メタデータ) (2024-11-27T19:04:40Z) - Boosting Flow-based Generative Super-Resolution Models via Learned Prior [8.557017814978334]
フローベース超解像(SR)モデルは、高品質な画像を生成する際に驚くべき能力を示した。
これらの手法は、グリッドアーティファクト、爆発する逆数、固定サンプリング温度による最適以下の結果など、画像生成中にいくつかの課題に遭遇する。
本研究では、フローベースSRモデルの推論フェーズ前に学習した条件を導入する。
論文 参考訳(メタデータ) (2024-03-16T18:04:12Z) - D-Flow: Differentiating through Flows for Controlled Generation [37.80603174399585]
フローを微分することで生成プロセスを制御するフレームワークであるD-Flowを紹介する。
我々は、ガウス確率パスで訓練された拡散/FMモデルに対して、生成過程を微分することで、データ多様体の勾配を予測できるというキーとなる観察によって、この枠組みを動機付けている。
我々は,画像と音声の逆問題や条件分子生成など,線形および非線形に制御された生成問題に対する枠組みを検証する。
論文 参考訳(メタデータ) (2024-02-21T18:56:03Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - What Matters in Unsupervised Optical Flow [51.45112526506455]
教師なし光流における鍵成分の集合を比較し解析する。
教師なしフローモデルに対する新しい改良点を多数構築する。
本稿では,従来の最先端技術よりもはるかに優れた非教師なしフロー技術を提案する。
論文 参考訳(メタデータ) (2020-06-08T19:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。