論文の概要: Flow Map Denoisers: Traversing the Distortion-Perception Plane for Inverse Problems
- arxiv url: http://arxiv.org/abs/2606.19802v1
- Date: Thu, 18 Jun 2026 05:15:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.659153
- Title: Flow Map Denoisers: Traversing the Distortion-Perception Plane for Inverse Problems
- Title(参考訳): フローマップデノイザ:逆問題に対する歪み知覚平面のトラバース
- Authors: Nicolas Zilberstein, Morteza Mardani, Santiago Segarra,
- Abstract要約: 画像復元は基本的なトレードオフに直面している: エラーを最小限に抑える手法はぼやけた再構成を生み出し、知覚的品質を最大化する手法はシャープだが忠実でない画像を生み出す。
フローマップモデルは、歪み知覚フロンティアを連続的に分散する1パラメータのデノイザ群を暗黙的に定義する。
Plug-and-Playソルバ内では、同じメカニズムが一般的な逆問題にまで拡張され、知覚的アライメントとデータの一貫性のトレードオフを制御する。
- 参考スコア(独自算出の注目度): 48.501415601682815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image restoration faces a fundamental tradeoff: methods that minimize error produce blurry reconstructions, while those that maximize perceptual quality yield sharp but less faithful images. Existing approaches either commit to a single operating point on this distortion perception (DP) frontier or require paired-data supervision, auxiliary models, or hyperparameter tuning of the sampler to access different points. We show that flow map models, a recent extension of flow matching for few-step sampling that learns an average field, implicitly define a one-parameter family of denoisers that continuously spans the DP frontier. The lookahead parameter t acts as a control knob between the MMSE and perceptual regimes. For Gaussian targets, we prove that varying t exactly recovers the optimal DP frontier; for natural images, we observe similar behavior empirically. Within a Plug-and-Play solver, the same mechanism extends to general inverse problems, where it controls a tradeoff between perceptual alignment and data consistency. Despite the lack of exact optimality guarantees in this setting, a single trained flow map spans the DP tradeoff, matching or exceeding specialized baselines at both extremes. Extensive experiments on CelebA ($128\times 128$) and AFHQ ($256\times 256$) across several linear and nonlinear inverse tasks validate our findings.
- Abstract(参考訳): 画像復元は基本的なトレードオフに直面している: エラーを最小限に抑える手法はぼやけた再構成を生み出し、知覚的品質を最大化する手法はシャープだが忠実でない画像を生み出す。
既存のアプローチは、この歪み知覚(DP)フロンティア上の1つの操作点にコミットするか、または異なる点にアクセスするためにサンプルのペアデータ監視、補助モデル、あるいはハイパーパラメータチューニングを必要とする。
平均フィールドを学習する数ステップサンプリングのためのフローマッチングの最近の拡張であるフローマップモデルでは,DPフロンティアを連続的に横断する1パラメータのデノイザ群を暗黙的に定義する。
lookaheadパラメータtは、MMSEと知覚的レジームの間の制御ノブとして機能する。
ガウス的対象に対しては, 様々な t が最適なDPフロンティアを正確に回復することを示す。
Plug-and-Playソルバ内では、同じメカニズムが一般的な逆問題にまで拡張され、知覚的アライメントとデータの一貫性のトレードオフを制御する。
この設定で正確な最適性の保証がないにもかかわらず、訓練された単一のフローマップはDPトレードオフにまたがり、両方の極端において特別なベースラインに一致するか、あるいは超える。
CelebA (128\times 128$) とAFHQ (256\times 256$) の線形および非線形の逆問題に対する大規模な実験は、我々の発見を裏付けるものである。
関連論文リスト
- Closed-Form Spectral Regularization for Multi-Task Model Merging [96.82449201305234]
モデルマージは、個別に調整された複数の専門家をトレーニングデータなしで単一のマルチタスクモデルに結合する。
State-of-the-art merging method formulate merging as a layer-wise interference problem。
本稿では,逐次降下の勾配-流路に一致するソフト指数フィルタを組み合わせた閉形式手法SWUDIを提案する。
論文 参考訳(メタデータ) (2026-06-05T14:00:47Z) - Amortized Guidance for Image Inpainting with Pretrained Diffusion Models [3.9819516108444115]
生成拡散モデルを用いた画像インパインティングについて検討した。
拡散処理によるアモルタイズインペインティング(Amortized Inpainting with Diffusion)と呼ばれる中層モデルを導入する。
AIDは、トレーニング済みの拡散バックボーンを固定し、小さな再利用可能なガイダンスモジュールをオフラインでトレーニングし、インスタンスごとの最適化なしにマスクされたイメージ間で再利用する。
論文 参考訳(メタデータ) (2026-05-13T05:02:47Z) - OSCAR: Orthogonal Stochastic Control for Alignment-Respecting Diversity in Flow Matching [14.664226708184676]
フローベースのテキスト・ツー・イメージモデルは決定論的軌跡に従っており、ユーザーは様々なモードを見つけるために繰り返しサンプルを採取せざるを得ない。
本稿では,フロー自体を多様性に配慮した,トレーニング不要な推論時間制御機構を提案する。
論文 参考訳(メタデータ) (2025-10-10T07:07:19Z) - Diffusion Models for Solving Inverse Problems via Posterior Sampling with Piecewise Guidance [52.705112811734566]
断片的なガイダンススキームを用いて,逆問題を解決するための新しい拡散型フレームワークが導入された。
提案手法は問題に依存しず,様々な逆問題に容易に適応できる。
このフレームワークは, (4時間), (8時間) の超分解能タスクに対して, (23%), (24%) および (24%) の無作為マスクを塗布する場合の (25%) の推論時間を短縮する。
論文 参考訳(メタデータ) (2025-07-22T19:35:14Z) - Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model [35.91741991271154]
歪み知覚トレードオフは、歪みメトリクスと知覚品質の根本的な矛盾を明らかにします。
本稿では,1つのスコアネットワークがDPトレードオフを効果的かつ柔軟に越えられることを示す。
論文 参考訳(メタデータ) (2025-03-26T07:37:53Z) - BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - Semi-Supervised Coupled Thin-Plate Spline Model for Rotation Correction and Beyond [84.56978780892783]
制御点が限られている複数のTPSを、より柔軟で強力な変換に繰り返し結合するCoupledTPSを提案する。
注記コストを考慮に入れた半教師付き学習手法を開発し、ラベルのないデータを活用することにより、ワープ品質を向上させる。
実験は、回転補正のための既存の最先端解よりもCoupledTPSの優位性と普遍性を示す。
論文 参考訳(メタデータ) (2024-01-24T13:03:28Z) - Improving Diffusion Models for Inverse Problems using Manifold Constraints [55.91148172752894]
我々は,現在の解法がデータ多様体からサンプルパスを逸脱し,エラーが蓄積することを示す。
この問題に対処するため、多様体の制約に着想を得た追加の補正項を提案する。
本手法は理論上も経験上も従来の方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-02T09:06:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。