論文の概要: Learning A Physical-aware Diffusion Model Based on Transformer for
Underwater Image Enhancement
- arxiv url: http://arxiv.org/abs/2403.01497v1
- Date: Sun, 3 Mar 2024 12:17:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 21:05:22.150535
- Title: Learning A Physical-aware Diffusion Model Based on Transformer for
Underwater Image Enhancement
- Title(参考訳): 水中画像強調のための変圧器を用いた物理認識拡散モデル学習
- Authors: Chen Zhao, Chenyu Dong, Weiling Cai
- Abstract要約: 本稿では,拡散過程の導出に物理知識を活用するための新しいUIEフレームワークであるPA-Diffを紹介する。
拡散過程を導くために物理の事前知識を利用することで、PDTブランチは水中認識能力を獲得し、現実世界の水中シーンにおける複雑な分布をモデル化することができる。
- 参考スコア(独自算出の注目度): 6.241209912291065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater visuals undergo various complex degradations, inevitably
influencing the efficiency of underwater vision tasks. Recently, diffusion
models were employed to underwater image enhancement (UIE) tasks, and gained
SOTA performance. However, these methods fail to consider the physical
properties and underwater imaging mechanisms in the diffusion process, limiting
information completion capacity of diffusion models. In this paper, we
introduce a novel UIE framework, named PA-Diff, designed to exploiting the
knowledge of physics to guide the diffusion process.
PA-Diff consists of Physics Prior Generation (PPG) Branch and Physics-aware
Diffusion Transformer (PDT) Branch. Our designed PPG branch is a plug-and-play
network to produce the physics prior, which can be integrated into any deep
framework. With utilizing the physics prior knowledge to guide the diffusion
process, PDT branch can obtain underwater-aware ability and model the complex
distribution in real-world underwater scenes. Extensive experiments prove that
our method achieves best performance on UIE tasks.
- Abstract(参考訳): 水中視覚は様々な複雑な劣化を受け、必然的に水中視覚タスクの効率に影響を及ぼす。
近年,水中画像強調(UIE)タスクに拡散モデルが採用され,SOTA性能が向上した。
しかし、これらの手法は拡散過程における物理的特性や水中イメージング機構を考慮せず、拡散モデルの情報完成能力を制限する。
本稿では,拡散過程の導出に物理知識を活用するための新しいUIEフレームワークであるPA-Diffを紹介する。
PA-Diffは物理優先生成(PPG)ブランチと物理対応拡散変換(PDT)ブランチで構成される。
我々の設計したPSGブランチは、物理を事前に生成するためのプラグアンドプレイネットワークであり、どんなディープフレームワークにも組み込める。
拡散過程の指導に物理事前知識を利用することで、pdtブランチは水中認識能力を獲得し、実世界の水中シーンにおける複雑な分布をモデル化することができる。
広範な実験により,本手法がuieタスクで最高の性能を発揮することを証明した。
関連論文リスト
- Vision-Informed Flow Image Super-Resolution with Quaternion Spatial
Modeling and Dynamic Flow Convolution [49.45309818782329]
フロー画像超解像(FISR)は、低分解能フロー画像から高分解能乱流速度場を復元することを目的としている。
既存のFISR法は主に自然画像パターンのフロー画像を処理する。
第一流れの視覚特性インフォームドFISRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-29T06:48:16Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - UIEDP:Underwater Image Enhancement with Diffusion Prior [20.349103580702028]
水中画像強調(UIE)は,低品質水中画像から鮮明な画像を生成することを目的としている。
劣化した水中の入力に条件付きクリアな画像の後方分布サンプリングプロセスとして,UIEを取り扱う新しいフレームワークであるUIEDPを提案する。
論文 参考訳(メタデータ) (2023-12-11T09:24:52Z) - DiffiT: Diffusion Vision Transformers for Image Generation [88.08529836125399]
ViT(Vision Transformer)は、特に認識タスクにおいて、強力なモデリング機能とスケーラビリティを実証している。
拡散型生成学習におけるViTの有効性について検討し、拡散ビジョン変換器(DiffiT)と呼ばれる新しいモデルを提案する。
DiffiTはパラメータ効率が大幅に向上した高忠実度画像を生成するのに驚くほど効果的である。
論文 参考訳(メタデータ) (2023-12-04T18:57:01Z) - A Generalized Physical-knowledge-guided Dynamic Model for Underwater
Image Enhancement [15.625794673532509]
我々は、物理知識誘導動的モデル(GUPDM用ショート)による一般化水中画像強調法を設計する。
本研究は, 大気光と透過率を変化させ, 様々な水中画像タイプをシミュレートする。
次に、動的畳み込みを用いて水中画像から事前情報を適応的に抽出し、PMSのパラメータを生成するADSとTDSを設計する。
論文 参考訳(メタデータ) (2023-08-10T09:09:15Z) - WaterFlow: Heuristic Normalizing Flow for Underwater Image Enhancement
and Beyond [52.27796682972484]
既存の水中画像強調法は, 画像品質の向上に重点を置いており, 実践への影響を無視している。
本稿では,検出駆動型水中画像強調のための正規化フローであるWaterFlowを提案する。
微分可能性や解釈可能性を考慮すると、事前をデータ駆動マッピング手法に組み込む。
論文 参考訳(メタデータ) (2023-08-02T04:17:35Z) - Physics-Aware Semi-Supervised Underwater Image Enhancement [7.634972737905042]
物理に基づく水中画像形成モデル(IFM)と深層学習技術(UIE)のどちらも活用する。
本稿では,伝送推定水蒸気 (T-Stream) とアンビエント光推定水蒸気 (A-Stream) を組み合わせた新しい物理対応デュアルストリーム水中画像強調ネットワーク,すなわちPA-UIENetを提案する。
本手法は, 劣化推定およびUIEタスクにおいて, 5つのテストセットにまたがる8つのベースラインよりも, あるいは少なくとも同等に, 性能が向上する。
論文 参考訳(メタデータ) (2023-07-21T10:10:18Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Domain Adaptive Adversarial Learning Based on Physics Model Feedback for
Underwater Image Enhancement [10.143025577499039]
物理モデルに基づくフィードバック制御と,水中画像の高機能化のための領域適応機構を用いた,新しい頑健な対角学習フレームワークを提案する。
水中画像形成モデルを用いてRGB-Dデータから水中訓練データセットをシミュレーションする新しい手法を提案する。
合成および実水中画像の最終的な改良結果は,提案手法の優位性を示している。
論文 参考訳(メタデータ) (2020-02-20T07:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。