論文の概要: Unifying Deep Stochastic Processes for Image Enhancement
- arxiv url: http://arxiv.org/abs/2605.01568v1
- Date: Sat, 02 May 2026 18:40:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.834506
- Title: Unifying Deep Stochastic Processes for Image Enhancement
- Title(参考訳): 画像強調のための深部確率過程の統一
- Authors: Wojciech Kozłowski, Radosław Kuczbański, Kamil Adamczewski, Karol Szczypkowski, Maciej Zięba,
- Abstract要約: 本稿では,最近の手法を連続処理の3つのファミリに分類することで,画像強調の統一的な視点を導入する。
これらのアプローチのすべては、共通微分方程式(SDE)の定式化から生じることを示す。
我々は、同一のアーキテクチャとトレーニングプロトコルを用いて、複数の画像強調タスクに対して、制御された実証的研究を行う。
- 参考スコア(独自算出の注目度): 2.2649197740853677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep stochastic processes have recently become a central paradigm for image enhancement, with many methods explicitly conditioning the stochastic trajectory on the degraded input. However, the relationship between these conditional processes and standard diffusion models remains unclear. In this work, we introduce a unified perspective on stochastic image enhancement by classifying recent methods into three families of continuous-time processes: unconditional diffusion models, Ornstein-Uhlenbeck (OU) processes, and diffusion bridges. We show that all of these approaches arise from a common stochastic differential equation (SDE) formulation. This framework makes explicit that seemingly disparate methods differ primarily in their drift and diffusion terms, terminal distributions, and boundary conditions, while schedulers and samplers constitute orthogonal design choices. Leveraging this unification, we conduct a controlled empirical study across multiple image enhancement tasks using identical architectures and training protocols. Our results reveal no consistently dominant method; instead, we identify and disentangle the specific design choices that most strongly influence performance. Finally, we release ItoVision, a modular PyTorch library that implements the unified framework and enables rapid prototyping and fair comparison of stochastic image enhancement methods.
- Abstract(参考訳): 近年、深部確率過程は画像強調の中心パラダイムとなり、多くの手法が劣化した入力に対して確率軌道を明示的に条件付けている。
しかし、これらの条件付き過程と標準拡散モデルとの関係はいまだ不明である。
本研究では,最近の手法を非条件拡散モデル,オルンシュタイン・ウレンベック法(OU)プロセス,拡散ブリッジの3つのファミリに分類することで,確率的画像強調に関する統一的な視点を導入する。
これらのアプローチのすべては、共通確率微分方程式(SDE)の定式化から生じることを示す。
このフレームワークは、一見異なる手法が主にドリフトと拡散の項、終端分布、境界条件で異なることを明確にし、スケジューラとスケジューラは直交的な設計選択を構成する。
この統合を活用して、同一のアーキテクチャとトレーニングプロトコルを用いて、複数の画像強調タスクにまたがる制御された実証的研究を行う。
その代わりに、パフォーマンスに最も強く影響する特定の設計選択を特定し、分離する。
最後に、統合されたフレームワークを実装し、高速なプロトタイピングと確率的画像強調手法の公正な比較を可能にするモジュール型PyTorchライブラリであるItoVisionをリリースする。
関連論文リスト
- Semantic Editing with Coupled Stochastic Differential Equations [14.747544527069804]
我々は,任意の事前学習された生成モデルのサンプリング過程を導くために,結合微分方程式(結合SDE)を提案する。
ソース画像と編集画像の両方を同一の相関雑音で駆動することにより,新たなサンプルを所望のセマンティクスに導出する。
論文 参考訳(メタデータ) (2025-09-29T03:05:16Z) - Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas [33.334956022229846]
本稿では,Merge-Attend-Diffuse演算子を提案する。
具体的には、拡散経路をマージし、自己および横断的意図をプログラムし、集約された潜在空間で操作する。
提案手法は,生成した画像の入力プロンプトと視覚的品質との整合性を維持しつつ,セマンティック・コヒーレンスを増大させる。
論文 参考訳(メタデータ) (2024-08-28T09:22:32Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - Fast Diffusion EM: a diffusion model for blind inverse problems with
application to deconvolution [0.0]
現在の手法では、劣化が知られており、復元と多様性の点で印象的な結果をもたらすと仮定している。
本研究では、これらのモデルの効率を活用し、復元された画像と未知のパラメータを共同で推定する。
本手法は,拡散モデルから抽出したサンプルを用いて,問題の対数類似度を近似し,未知のモデルパラメータを推定する方法とを交互に比較する。
論文 参考訳(メタデータ) (2023-09-01T06:47:13Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。