論文の概要: Physics Informed Capsule Enhanced Variational AutoEncoder for Underwater Image Enhancement
- arxiv url: http://arxiv.org/abs/2506.04753v1
- Date: Thu, 05 Jun 2025 08:39:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.60505
- Title: Physics Informed Capsule Enhanced Variational AutoEncoder for Underwater Image Enhancement
- Title(参考訳): 水中画像強調のための物理インフォームカプセル強化変分オートエンコーダ
- Authors: Niki Martinel, Rita Pucci,
- Abstract要約: 本稿では,最先端の水中画像強調を実現する新しいデュアルストリームアーキテクチャを提案する。
本手法は,専用物理推定器による送信マップと背景光の空間変化を同時に推定する。
提案手法は,複数の空間周波数にまたがる物理的定着と知覚的品質の両立を保証する新しい最適化目標も備えている。
- 参考スコア(独自算出の注目度): 8.16306466526838
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a novel dual-stream architecture that achieves state-of-the-art underwater image enhancement by explicitly integrating the Jaffe-McGlamery physical model with capsule clustering-based feature representation learning. Our method simultaneously estimates transmission maps and spatially-varying background light through a dedicated physics estimator while extracting entity-level features via capsule clustering in a parallel stream. This physics-guided approach enables parameter-free enhancement that respects underwater formation constraints while preserving semantic structures and fine-grained details. Our approach also features a novel optimization objective ensuring both physical adherence and perceptual quality across multiple spatial frequencies. To validate our approach, we conducted extensive experiments across six challenging benchmarks. Results demonstrate consistent improvements of $+0.5$dB PSNR over the best existing methods while requiring only one-third of their computational complexity (FLOPs), or alternatively, more than $+1$dB PSNR improvement when compared to methods with similar computational budgets. Code and data \textit{will} be available at https://github.com/iN1k1/.
- Abstract(参考訳): 本稿では,Jaffe-McGlamery物理モデルとカプセルクラスタリングに基づく特徴表現学習を明示的に統合することにより,最先端の水中画像強調を実現する新しいデュアルストリームアーキテクチャを提案する。
本手法は, 並列ストリームにおけるカプセルクラスタリングによる実体レベルの特徴を抽出しながら, 物理推定器による透過マップと空間変動背景光を同時に推定する。
この物理誘導的なアプローチは、セマンティック構造と詳細な詳細を保存しながら、水中形成の制約を尊重するパラメータフリーな拡張を可能にする。
提案手法は,複数の空間周波数にまたがる物理的定着と知覚的品質の両立を保証する新しい最適化目標も備えている。
提案手法を検証するため,6つの試行錯誤ベンチマークを用いて広範囲な実験を行った。
その結果,計算量(FLOP)の3分の1しか必要とせず,既存の手法に比べて$0.5$dBPSNRが一貫した改善を達成できた。
コードとデータ \textit{will} はhttps://github.com/iN1k1/.com/で入手できる。
関連論文リスト
- Layer-wise Quantization for Quantized Optimistic Dual Averaging [75.4148236967503]
我々は、訓練の過程で不均一性に適応し、厳密な分散とコード長境界を持つ一般的な層ワイド量子化フレームワークを開発する。
本稿では,適応学習率を持つ量子最適化双対平均化(QODA)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-20T13:53:58Z) - A Geometry-Aware Message Passing Neural Network for Modeling Aerodynamics over Airfoils [61.60175086194333]
空気力学は航空宇宙工学の重要な問題であり、しばしば翼のような固体物と相互作用する流れを伴う。
本稿では, 固体物体上の非圧縮性流れのモデル化について考察する。
ジオメトリを効果的に組み込むため,メッシュ表現に翼形状を効率よく,かつ効率的に統合するメッセージパッシング方式を提案する。
これらの設計選択は、純粋にデータ駆動の機械学習フレームワークであるGeoMPNNにつながり、NeurIPS 2024 ML4CFDコンペティションで最優秀学生賞を受賞し、総合で4位となった。
論文 参考訳(メタデータ) (2024-12-12T16:05:39Z) - Lightweight Deep Learning Framework for Accurate Particle Flow Energy Reconstruction [8.598010350935596]
本稿では,ディープラーニング再構築の枠組みを体系的に評価する。
重み付き平均2乗と誤差構造類似度指数を組み合わせたハイブリッド損失関数を設計する。
我々は,モーダル時間的相関とエネルギー変位非線形性を捉えるモデルの能力を強化する。
論文 参考訳(メタデータ) (2024-10-08T11:49:18Z) - KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。
我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。
我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T05:48:24Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - DualFluidNet: an Attention-based Dual-pipeline Network for FLuid Simulation [4.694954114339147]
本研究では,注意型デュアルパイプネットワークを用いた3次元流体シミュレーションの革新的手法を提案する。
グローバルな流体制御と物理法則のバランスを改善する方法を見つける。
また、より複雑なシーンを扱うネットワークの能力をさらに探求する新たなデータセットであるTurton3Dを提案する。
論文 参考訳(メタデータ) (2023-12-28T07:37:11Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Variational Bayes image restoration with compressive autoencoders [4.879530644978008]
逆問題の正規化は、計算イメージングにおいて最重要となる。
本研究では,まず,最先端生成モデルの代わりに圧縮型オートエンコーダを提案する。
第2の貢献として、変分ベイズ潜時推定(VBLE)アルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-11-29T15:49:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。