論文の概要: 4KDehazeFlow: Ultra-High-Definition Image Dehazing via Flow Matching
- arxiv url: http://arxiv.org/abs/2511.09055v1
- Date: Thu, 13 Nov 2025 01:29:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.384498
- Title: 4KDehazeFlow: Ultra-High-Definition Image Dehazing via Flow Matching
- Title(参考訳): 4KDehazeFlow:フローマッチングによる超高精細画像デハージング
- Authors: Xingchi Chen, Pu Wang, Xuerui Li, Chaopeng Li, Juxiang Zhou, Jianhou Gan, Dianjie Lu, Guijuan Zhang, Wenqi Ren, Zhuoran Zheng,
- Abstract要約: 4KDehazeFlowはフローマッチングとHaze-Awareベクトル場に基づく新しい手法である。
高品質な脱ハージングのための効率的なデータ駆動適応型非線形色変換を提供する。
2dBのPSNR増加と高密度の迷路と色忠実度の性能向上を実現している。
- 参考スコア(独自算出の注目度): 47.857232695201645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ultra-High-Definition (UHD) image dehazing faces challenges such as limited scene adaptability in prior-based methods and high computational complexity with color distortion in deep learning approaches. To address these issues, we propose 4KDehazeFlow, a novel method based on Flow Matching and the Haze-Aware vector field. This method models the dehazing process as a progressive optimization of continuous vector field flow, providing efficient data-driven adaptive nonlinear color transformation for high-quality dehazing. Specifically, our method has the following advantages: 1) 4KDehazeFlow is a general method compatible with various deep learning networks, without relying on any specific network architecture. 2) We propose a learnable 3D lookup table (LUT) that encodes haze transformation parameters into a compact 3D mapping matrix, enabling efficient inference through precomputed mappings. 3) We utilize a fourth-order Runge-Kutta (RK4) ordinary differential equation (ODE) solver to stably solve the dehazing flow field through an accurate step-by-step iterative method, effectively suppressing artifacts. Extensive experiments show that 4KDehazeFlow exceeds seven state-of-the-art methods. It delivers a 2dB PSNR increase and better performance in dense haze and color fidelity.
- Abstract(参考訳): UHD(Ultra-High-Definition)画像デハージングは、事前手法におけるシーン適応性の制限や、ディープラーニングアプローチにおける色歪みを伴う高い計算複雑性といった課題に直面している。
本研究では,フローマッチングとHaze-Awareベクトル場に基づく新しい手法である4KDehazeFlowを提案する。
この方法は、デハジング過程を連続ベクトル場流の漸進最適化としてモデル化し、高品質なデハジングのための効率的なデータ駆動適応非線形色変換を提供する。
具体的には,本手法には次のような利点がある。
1) 4KDehazeFlowは、特定のネットワークアーキテクチャに頼ることなく、様々なディープラーニングネットワークと互換性のある一般的な手法である。
2) ハウズ変換パラメータをコンパクトな3次元マッピング行列に符号化した学習可能な3次元ルックアップテーブル(LUT)を提案する。
3) 4階のルンゲ・クッタ(RK4) 常微分方程式(ODE) を用いて, 正確なステップバイステップ反復法により脱ハージング流場を安定に解き, アーティファクトを効果的に抑制する。
大規模な実験によると、4KDehazeFlowは7つの最先端の手法を超越している。
2dBのPSNR増加と高密度の迷路と色忠実度の性能向上を実現している。
関連論文リスト
- Diff4Splat: Controllable 4D Scene Generation with Latent Dynamic Reconstruction Models [79.06910348413861]
Diff4Splatは、単一の画像から制御可能で明示的な4Dシーンを合成するフィードフォワード方式である。
単一の入力画像、カメラ軌跡、オプションのテキストプロンプトが与えられた場合、Diff4Splatは外見、幾何学、動きを符号化する変形可能な3Dガウス場を直接予測する。
論文 参考訳(メタデータ) (2025-11-01T11:16:25Z) - FlowLUT: Efficient Image Enhancement via Differentiable LUTs and Iterative Flow Matching [10.213645938731338]
FlowLUTは、LUTの効率性、複数プリエント、フローマッチングされた再構成画像のパラメータ非依存特性を統合する、新しいエンドツーエンドモデルである。
軽量な融合予測ネットワークは複数の3D LUT上で動作し、シーン適応色補正には$mathcalO(1)$の複雑さがある。
モデル全体は、知覚的および構造的忠実性を含む複合損失関数の下で共同最適化される。
論文 参考訳(メタデータ) (2025-09-28T03:22:01Z) - Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文 参考訳(メタデータ) (2025-08-06T16:16:58Z) - Gaussian Primitives for Deformable Image Registration [9.184092856125067]
脳MRI、肺CT、心臓MRIのデータセットの実験結果から、GaussianDIRは既存のDIR法よりも精度と効率が優れていることが示されている。
トレーニングなしのアプローチとして、反復的手法は本質的に遅く、一般化不足の限界を超越しているというステレオタイプに挑戦する。
論文 参考訳(メタデータ) (2024-06-05T15:44:54Z) - TriPlaneNet: An Encoder for EG3D Inversion [1.9567015559455132]
NeRFをベースとしたGANは、人間の頭部の高分解能かつ高忠実な生成モデリングのための多くのアプローチを導入している。
2D GANインバージョンのための普遍的最適化に基づく手法の成功にもかかわらず、3D GANに適用された手法は、結果を新しい視点に外挿することができないかもしれない。
本稿では,EG3D生成モデルに提示された3面表現を直接利用することにより,両者のギャップを埋める高速な手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T17:56:20Z) - 4K-NeRF: High Fidelity Neural Radiance Fields at Ultra High Resolutions [19.380248980850727]
超高分解能の難易度シナリオにおいて、高忠実度ビュー合成を追求するために、4K-NeRFという新規で効果的なフレームワークを提案する。
本稿では,高頻度詳細回復のために線量相関を探索し,この問題に対処する。
提案手法は, 4K超高分解能シナリオにおいて, 最新のNeRF法と比較して, 高周波数細部でのレンダリング品質を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-12-09T07:26:49Z) - V4d: voxel for 4d novel view synthesis [21.985228924523543]
我々は、V4Dと略される4次元神経放射場をモデル化するために3D Voxelを使用し、3Dvoxelは2つのフォーマットを持つ。
提案した LUTs ベースの改良モジュールは,計算コストの少ない性能向上を実現する。
論文 参考訳(メタデータ) (2022-05-28T04:45:07Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Learning Deformable Tetrahedral Meshes for 3D Reconstruction [78.0514377738632]
学習に基づく3次元再構成に対応する3次元形状表現は、機械学習とコンピュータグラフィックスにおいてオープンな問題である。
ニューラル3D再構成に関するこれまでの研究は、利点だけでなく、ポイントクラウド、ボクセル、サーフェスメッシュ、暗黙の関数表現といった制限も示していた。
Deformable Tetrahedral Meshes (DefTet) を, ボリューム四面体メッシュを再構成問題に用いるパラメータ化として導入する。
論文 参考訳(メタデータ) (2020-11-03T02:57:01Z) - Towards Reading Beyond Faces for Sparsity-Aware 4D Affect Recognition [55.15661254072032]
自動4次元表情認識(FER)のための空間認識深層ネットワークを提案する。
まず,深層学習のためのデータ制限問題に対処する新しい拡張手法を提案する。
次に、多視点での畳み込み特徴のスパース表現を計算するために、疎度対応のディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-08T13:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。