論文の概要: WaterFlow: Explicit Physics-Prior Rectified Flow for Underwater Saliency Mask Generation
- arxiv url: http://arxiv.org/abs/2510.12605v1
- Date: Tue, 14 Oct 2025 15:02:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.361617
- Title: WaterFlow: Explicit Physics-Prior Rectified Flow for Underwater Saliency Mask Generation
- Title(参考訳): 水流:水面の塩分濃度マスク生成のための比例的な物理パラメータ整流
- Authors: Runting Li, Shijie Lian, Hua Li, Yutong Li, Wenhui Wu, Sam Kwong,
- Abstract要約: 本研究では,水中の有人物体検出のための修正フローベースフレームワークであるWaterFlowを提案する。
WaterFlowは、水中の物理画像情報をネットワークトレーニングプロセスに直接明示的な事前情報として組み込む。
UOD10Kデータセットにおいて、WaterFlowはS_mの0.072のゲインを達成し、本手法の有効性と優位性を実証した。
- 参考スコア(独自算出の注目度): 47.83249844545859
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater Salient Object Detection (USOD) faces significant challenges, including underwater image quality degradation and domain gaps. Existing methods tend to ignore the physical principles of underwater imaging or simply treat degradation phenomena in underwater images as interference factors that must be eliminated, failing to fully exploit the valuable information they contain. We propose WaterFlow, a rectified flow-based framework for underwater salient object detection that innovatively incorporates underwater physical imaging information as explicit priors directly into the network training process and introduces temporal dimension modeling, significantly enhancing the model's capability for salient object identification. On the USOD10K dataset, WaterFlow achieves a 0.072 gain in S_m, demonstrating the effectiveness and superiority of our method. The code will be published after the acceptance.
- Abstract(参考訳): 水中唾液物検出(USOD)は、水中画像の品質劣化やドメインギャップなど、重大な課題に直面している。
既存の方法では、水中画像の物理的原理を無視したり、水中画像の劣化現象を、それらを含む貴重な情報を十分に活用できない干渉要因として扱う傾向がある。
本研究では,水中の物理的画像情報をネットワークトレーニングプロセスに直接組み入れ,時間次元モデリングを導入し,有意な物体識別のためのモデルの能力を大幅に向上させる,水中の有人物体検出のための補正フローベースフレームワークであるWaterFlowを提案する。
UOD10Kデータセットにおいて、WaterFlowはS_mの0.072のゲインを達成し、本手法の有効性と優位性を実証した。
コードは受理後公開される。
関連論文リスト
- Improving underwater semantic segmentation with underwater image quality attention and muti-scale aggregation attention [13.73105543582749]
UnderWater SegFormer (UWSegFormer) は、低品質水中画像のセマンティックセグメンテーションのためのトランスフォーマーベースのフレームワークである。
提案手法は,SOTA法と比較した場合,分割完全性,境界明細度,主観的知覚的詳細性の点で有利である。
論文 参考訳(メタデータ) (2025-03-30T12:47:56Z) - PIGUIQA: A Physical Imaging Guided Perceptual Framework for Underwater Image Quality Assessment [59.9103803198087]
水中画像品質評価(UIQA)のための物理画像ガイド型知覚フレームワークを提案する。
水中放射移動理論を応用して、物理に基づく画像推定を統合して、これらの歪みの定量的な測定値を確立する。
提案モデルは,画像品質のスコアを正確に予測し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-12-20T03:31:45Z) - Phaseformer: Phase-based Attention Mechanism for Underwater Image Restoration and Beyond [25.975859029063585]
水中画像復元(UIR)のための1.77Mパラメータを持つ軽量位相変換器ネットワークを提案する。
本手法は,位相に基づく自己認識機構を用いて,非汚染特徴を効果的に抽出することに焦点を当てる。
LOLデータセットを用いた低照度画像強調の有効性を示す。
論文 参考訳(メタデータ) (2024-12-02T12:48:19Z) - FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。
我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。
本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-25T03:54:01Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - WaterFlow: Heuristic Normalizing Flow for Underwater Image Enhancement
and Beyond [52.27796682972484]
既存の水中画像強調法は, 画像品質の向上に重点を置いており, 実践への影響を無視している。
本稿では,検出駆動型水中画像強調のための正規化フローであるWaterFlowを提案する。
微分可能性や解釈可能性を考慮すると、事前をデータ駆動マッピング手法に組み込む。
論文 参考訳(メタデータ) (2023-08-02T04:17:35Z) - Unpaired Overwater Image Defogging Using Prior Map Guided CycleGAN [60.257791714663725]
オーバーウォーターシーンで画像をデフォグするための先行マップガイドサイクロン (PG-CycleGAN) を提案する。
提案手法は,最先端の教師付き,半教師付き,非教師付きデグジングアプローチより優れている。
論文 参考訳(メタデータ) (2022-12-23T03:00:28Z) - A Novel Underwater Image Enhancement and Improved Underwater Biological
Detection Pipeline [8.326477369707122]
本稿では, YOLOv5 バックボーンに畳み込みブロックアテンションモジュール (CBAM) を付加した特徴情報を取得する手法を提案する。
物体特性に対する水中生物特性の干渉が減少し、対象情報に対するバックボーンネットワークの出力が向上する。
論文 参考訳(メタデータ) (2022-05-20T14:18:17Z) - Domain Adaptive Adversarial Learning Based on Physics Model Feedback for
Underwater Image Enhancement [10.143025577499039]
物理モデルに基づくフィードバック制御と,水中画像の高機能化のための領域適応機構を用いた,新しい頑健な対角学習フレームワークを提案する。
水中画像形成モデルを用いてRGB-Dデータから水中訓練データセットをシミュレーションする新しい手法を提案する。
合成および実水中画像の最終的な改良結果は,提案手法の優位性を示している。
論文 参考訳(メタデータ) (2020-02-20T07:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。