論文の概要: Enhancing Underwater Light Field Images via Global Geometry-aware Diffusion Process
- arxiv url: http://arxiv.org/abs/2601.21179v1
- Date: Thu, 29 Jan 2026 02:27:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.519094
- Title: Enhancing Underwater Light Field Images via Global Geometry-aware Diffusion Process
- Title(参考訳): 地球測光対応拡散プロセスによる水中光場画像の強調
- Authors: Yuji Lin, Qian Zhao, Zongsheng Yue, Junhui Hou, Deyu Meng,
- Abstract要約: GeoDiff-LFは、SD-Turbo上に構築された新しい拡散ベースのフレームワークで、水中4次元LFイメージングを強化する。
拡散先行とLF幾何を統合することにより、GeoDiff-LFは水中のシーンにおける色歪みを効果的に緩和する。
- 参考スコア(独自算出の注目度): 93.00033672476206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work studies the challenging problem of acquiring high-quality underwater images via 4-D light field (LF) imaging. To this end, we propose GeoDiff-LF, a novel diffusion-based framework built upon SD-Turbo to enhance underwater 4-D LF imaging by leveraging its spatial-angular structure. GeoDiff-LF consists of three key adaptations: (1) a modified U-Net architecture with convolutional and attention adapters to model geometric cues, (2) a geometry-guided loss function using tensor decomposition and progressive weighting to regularize global structure, and (3) an optimized sampling strategy with noise prediction to improve efficiency. By integrating diffusion priors and LF geometry, GeoDiff-LF effectively mitigates color distortion in underwater scenes. Extensive experiments demonstrate that our framework outperforms existing methods across both visual fidelity and quantitative performance, advancing the state-of-the-art in enhancing underwater imaging. The code will be publicly available at https://github.com/linlos1234/GeoDiff-LF.
- Abstract(参考訳): 本研究では,4次元光場(LF)イメージングによる高品質水中画像取得の課題について検討する。
この目的のために,SD-Turboをベースとした新しい拡散型フレームワークであるGeoDiff-LFを提案する。
GeoDiff-LFは,(1)畳み込み型およびアテンション型をモデルとしたU-Netアーキテクチャ,(2)テンソル分解とプログレッシブ重み付けを用いた幾何誘導損失関数,(3)雑音予測による最適化サンプリング戦略,の3つの主要な適応から構成される。
拡散先行とLF幾何を統合することにより、GeoDiff-LFは水中のシーンにおける色歪みを効果的に緩和する。
大規模な実験により、我々のフレームワークは視覚的忠実度と定量的性能の両方において既存の手法よりも優れており、水中イメージングの高度化における最先端の進展が示されている。
コードはhttps://github.com/linlos1234/GeoDiff-LFで公開されている。
関連論文リスト
- High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network [73.19214585791268]
本稿では,LLF-LUT++と呼ばれるピラミッドネットワークについて紹介する。
具体的には,ダウンサンプリング画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
LLF-LUT++は、HDR+データセット上でPSNRが2.64dB改善されただけでなく、4K解像度の画像を1つのGPUでわずか13msで処理することで、さらに削減されている。
論文 参考訳(メタデータ) (2025-10-13T16:52:32Z) - 3D-UIR: 3D Gaussian for Underwater 3D Scene Reconstruction via Physics Based Appearance-Medium Decoupling [30.985414238960466]
3D Gaussian Splatting (3DGS)はリアルタイムレンダリング機能を提供するが、水中の不均一な環境に苦しむ。
水媒体効果から物体の外観を遠ざける物理ベースの枠組みを提案する。
提案手法は,高品質な新規ビュー合成と物理的に正確なシーン復元を実現する。
論文 参考訳(メタデータ) (2025-05-27T14:19:30Z) - Enhancing Underwater Imaging with 4-D Light Fields: Dataset and Method [77.80712860663886]
4次元光場(LF)は、光吸収、散乱、その他の課題に悩まされる水中イメージングを強化する。
水中4次元LF画像強調と深度推定のためのプログレッシブフレームワークを提案する。
学習手法の定量的評価と教師あり訓練のための,最初の4次元LFに基づく水中画像データセットを構築した。
論文 参考訳(メタデータ) (2024-08-30T15:06:45Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。