論文の概要: Disentangling Generation and Regression in Stochastic Interpolants for Controllable Image Restoration
- arxiv url: http://arxiv.org/abs/2605.21381v1
- Date: Wed, 20 May 2026 16:41:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.787778
- Title: Disentangling Generation and Regression in Stochastic Interpolants for Controllable Image Restoration
- Title(参考訳): 制御可能な画像復元のための確率補間器の異方性生成と回帰
- Authors: Yi Liu, Jia Ma, Wengen Li, Jihong Guan, Shuigeng Zhou, Yichao Zhang,
- Abstract要約: DiSIは、Interpolantプロセスを独立した生成および回帰コンポーネントに分離する統合フレームワークである。
本研究では,DiSIが画像復元タスクにおいて効率よく競合する結果を得ると同時に,単一モデル内での歪み知覚トレードオフを制御するための予測時間の柔軟性を独自に提供することを示す。
- 参考スコア(独自算出の注目度): 30.480465453951982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in Image Restoration (IR) have been largely driven by generative methods such as Diffusion Models and Flow Matching, which excel in synthesizing realistic textures while suffering from slow multi-step inference and compromised pixel fidelity. In contrast, classical regression-based IR methods excel precisely in these aspects, offering single-step efficiency and high pixel-level reconstruction fidelity. To bridge this gap, we propose DiSI, a unified framework that Disentangles the underlying Stochastic Interpolant process into independent generation and regression components. This decoupling endows DiSI with remarkable versatility, enabling a continuous and controllable transition from a pure regression process to a fully generative one. Technically, we instantiate this framework with two specific sampling trajectories, accompanied by a unified sampler for high-quality, few-step inference on arbitrary trajectories. Furthermore, we design a dual-branch U-Net style transformer network in pixel space, using a dedicated branch to enhance conditional guidance while ensuring high throughput. Extensive experiments demonstrate that DiSI efficiently achieves competitive results on various IR tasks, while uniquely offering the inference-time flexibility to control the distortion-perception trade-off within a single model.
- Abstract(参考訳): 画像復元(IR)の最近の進歩は拡散モデルやフローマッチングなどの生成手法によって大きく推進されている。
対照的に、古典回帰に基づくIR法はこれらの点において正確に優れており、シングルステップ効率と高ピクセルレベルの再構成忠実性を提供する。
このギャップを埋めるために、我々は、基礎となる確率補間プロセスを独立した生成および回帰コンポーネントに分解する統合フレームワークであるDiSIを提案する。
この疎結合はDiSIに顕著な汎用性を与え、純粋な回帰過程から完全な生成過程への連続的かつ制御可能な遷移を可能にする。
技術的には、このフレームワークを2つの特定のサンプリングトラジェクトリでインスタンス化する。
さらに、高スループットを確保しつつ条件付きガイダンスを強化するために、専用ブランチを用いて、画素空間におけるデュアルブランチU-Netスタイルのトランスフォーマネットワークを設計する。
広汎な実験により、DiSIは様々なIRタスクにおいて効率よく競合結果を達成する一方で、単一のモデル内での歪み知覚トレードオフを制御するための推論時間の柔軟性を提供する。
関連論文リスト
- UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation [51.41441081823758]
インターリーブドジェネレーションが可能な統一モデルが有望なパラダイムとして登場している。
インターリーブ・ジェネレーションに適した統合強化学習フレームワークを提案する。
実験により,この統合学習レシピは推論による画像生成品質を著しく向上させることが示された。
論文 参考訳(メタデータ) (2026-03-24T17:59:17Z) - Cross-Scenario Deraining Adaptation with Unpaired Data: Superpixel Structural Priors and Multi-Stage Pseudo-Rain Synthesis [48.809049043865905]
低レベルのコンピュータビジョンでは,イメージデライン化が重要な役割を担っている。
ディープラーニングのパラダイムは、目に見えないアウト・オブ・ディストリビューションシナリオに一般化された場合、厳しいパフォーマンス劣化に悩まされることが多い。
本稿では,クロスシナリオ・デライニング適応フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-23T07:38:55Z) - Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。
本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文 参考訳(メタデータ) (2025-12-28T05:48:55Z) - Fourier-RWKV: A Multi-State Perception Network for Efficient Image Dehazing [26.57698394898644]
マルチステート・パーセプション・パラダイムに基づく新しい脱ハージング・フレームワークを提案する。
Fourier-RWKVはさまざまなヘイズシナリオにまたがって最先端のパフォーマンスを提供する。
論文 参考訳(メタデータ) (2025-12-09T01:35:56Z) - Parallelly Tempered Generative Adversarial Nets: Toward Stabilized Gradients [7.94957965474334]
生成的敵対ネットワーク(GAN)は、生成的人工知能(AI)における代表的バックボーンモデルである。
本研究は,モード崩壊の存在下でのトレーニングの不安定性と非効率性を,対象分布におけるマルチモーダルにリンクすることで解析する。
新たに開発したGAN目標関数により, 生成元は同時に全ての誘電分布を学習することができる。
論文 参考訳(メタデータ) (2024-11-18T18:01:13Z) - Bidirectional Consistency Models [1.486435467709869]
拡散モデル(DM)は、ランダムなベクトルを反復的に認知することで、驚くほど高品質なサンプルを生成することができる。
DMはまた、確率フロー常微分方程式(PF ODE)に沿って後方に移動することにより、入力画像から雑音への逆変換も可能である。
論文 参考訳(メタデータ) (2024-03-26T18:40:36Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。