Fugu-MT 論文翻訳(概要): Unified Restoration-Perception Learning: Maritime Infrared-Visible Image Fusion and Segmentation

論文の概要: Unified Restoration-Perception Learning: Maritime Infrared-Visible Image Fusion and Segmentation

arxiv url: http://arxiv.org/abs/2603.28414v1
Date: Mon, 30 Mar 2026 13:26:05 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:45.410426
Title: Unified Restoration-Perception Learning: Maritime Infrared-Visible Image Fusion and Segmentation
Title（参考訳）: 統一再生-知覚学習:海中赤外可視画像融合とセグメンテーション
Authors: Weichao Cai, Weiliang Huang, Biao Xue, Chao Huang, Fei Yuan, Bob Zhang,
Abstract要約: 海洋環境における霧や強い反射は、画像劣化を引き起こす。海洋環境における霧や強い反射は、画像劣化を引き起こす。 Infrared-Visible Maritime Shipデータセットは、様々な天候と照明条件下での様々な海洋シナリオをカバーするために提案されている。このフレームワークは、劣化抑制と構造強化のための周波数・空間拡張補完(FSEC)モジュール、意味一貫性ガイダンスのためのセマンティック・ビジュアル・コンシスタンス・アテンション(SVCA)モジュール、選択的核融合のためのクロスモーダル誘導注意機構を含む。
参考スコア（独自算出の注目度）: 26.524834042246408
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Marine scene understanding and segmentation plays a vital role in maritime monitoring and navigation safety. However, prevalent factors like fog and strong reflections in maritime environments cause severe image degradation, significantly compromising the stability of semantic perception. Existing restoration and enhancement methods typically target specific degradations or focus solely on visual quality, lacking end-to-end collaborative mechanisms that simultaneously improve structural recovery and semantic effectiveness. Moreover, publicly available infrared-visible datasets are predominantly collected from urban scenes, failing to capture the authentic characteristics of coupled degradations in marine environments. To address these challenges, the Infrared-Visible Maritime Ship Dataset (IVMSD) is proposed to cover various maritime scenarios under diverse weather and illumination conditions. Building upon this dataset, a Multi-task Complementary Learning Framework (MCLF) is proposed to collaboratively perform image restoration, multimodal fusion, and semantic segmentation within a unified architecture. The framework includes a Frequency-Spatial Enhancement Complementary (FSEC) module for degradation suppression and structural enhancement, a Semantic-Visual Consistency Attention (SVCA) module for semantic-consistent guidance, and a cross-modality guided attention mechanism for selective fusion. Experimental results on IVMSD demonstrate that the proposed method achieves state-of-the-art segmentation performance, significantly enhancing robustness and perceptual quality under complex maritime conditions.
Abstract（参考訳）: 海洋環境の理解とセグメンテーションは海洋監視と航行安全において重要な役割を担っている。しかし、海洋環境における霧や強い反射のような一般的な要因は、画像の劣化を著しく引き起こし、意味的知覚の安定性を著しく損なう。既存の復元・拡張手法は、通常、特定の劣化を標的にするか、視覚的品質のみに焦点を合わせ、構造的回復と意味的効果を同時に改善するエンドツーエンドの協調メカニズムを欠いている。さらに、公共利用可能な赤外線可視データセットは、主に都市シーンから収集され、海洋環境における複合劣化の真の特性を捉えられなかった。これらの課題に対処するため、様々な天候および照明条件下での様々な海上シナリオをカバーするために、赤外線可視海事データセット(IVMSD)が提案されている。このデータセットに基づいて、画像復元、マルチモーダル融合、セマンティックセグメンテーションを統一アーキテクチャ内で協調的に行うために、MCLF(Multi-task Complementary Learning Framework)を提案する。このフレームワークは、劣化抑制と構造強化のための周波数・空間拡張補完(FSEC)モジュール、意味一貫性ガイダンスのためのセマンティック・ビジュアル・コンシスタンス・アテンション(SVCA)モジュール、選択的核融合のためのクロスモーダル誘導注意機構を含む。 IVMSD実験により, 複雑な海洋環境下での頑健性と知覚的品質を著しく向上し, 最先端のセグメンテーション性能を実現することが実証された。

関連論文リスト

Harmonizing the Deep: A Unified Information Pipeline for Robust Marine Biodiversity Assessment Across Heterogeneous Domains [0.769971486557519]
この研究は、北極と大西洋の海洋生態系を対象とする多年にわたる侵略的な種モニタリングイニシアチブの基礎的な検出層を確立する。異種データセットを同等の情報フローに標準化する統一情報パイプラインを開発した。シーン構成やオブジェクト密度,コンテキスト冗長性などの構造的要因から,ドメイン間の性能損失が説明できる。
論文参考訳（メタデータ） (2026-01-20T13:51:55Z)
ClusIR: Towards Cluster-Guided All-in-One Image Restoration [72.16989784735796]
ClusIRは、統一されたフレームワーク内でさまざまな劣化から高品質なイメージを復元することを目的としている。 ClusIRは、確率的クラスタ誘導ルーティング機構(PCGRM)と劣化対応周波数変調モジュール(DAFMM)の2つの重要なコンポーネントから構成される。
論文参考訳（メタデータ） (2025-12-11T18:59:47Z)
Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.92197418745822]
カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文参考訳（メタデータ） (2025-10-20T14:34:51Z)
DACA-Net: A Degradation-Aware Conditional Diffusion Network for Underwater Image Enhancement [16.719513778795367]
水中画像は通常、散乱や吸収といった複雑な光学効果により、激しい色歪み、視界の低さ、構造的明瞭さの低下に悩まされる。既存の拡張手法は、様々な劣化条件を適応的に扱うのに苦労し、水中固有の物理的前提を効果的に活用できないことが多い。本研究では,水中画像の適応的・堅牢性を高めるための劣化認識条件拡散モデルを提案する。
論文参考訳（メタデータ） (2025-07-30T09:16:07Z)
Marine Saliency Segmenter: Object-Focused Conditional Diffusion with Region-Level Semantic Knowledge Distillation [44.50637633194709]
海洋衛生(MSS)は、様々な視覚に基づく海洋探査において重要な役割を担っている。拡散モデルに基づく新しい海洋塩分セグメンタDiffMSSを提案する。我々は、過度に信頼された誤認識を抑制するために、専用決定論的コンセンサスサンプリングを開発する。
論文参考訳（メタデータ） (2025-04-03T08:31:36Z)
InterLCM: Low-Quality Images as Intermediate States of Latent Consistency Models for Effective Blind Face Restoration [106.70903819362402]
拡散前駆体は、低画質画像の復元のために、復元データセットの微細調整拡散モデル(DM)によってブラインドフェイス復元(BFR)に使用されている。我々は,その優れたセマンティック一貫性と効率のために潜在一貫性モデル(LCM)を活用するために,InterLCMを提案する。 InterLCMは、合成データセットと実世界のデータセットの両方において既存のアプローチより優れており、推論速度も高速である。
論文参考訳（メタデータ） (2025-02-04T10:51:20Z)
Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。 Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。 nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-12-28T14:23:58Z)
MvKSR: Multi-view Knowledge-guided Scene Recovery for Hazy and Rainy Degradation [8.955174143860681]
高品質のイメージングは、交通や産業などの分野における安全の監督とインテリジェントな展開を保証するために不可欠である。大気の湿潤度や降水などの悪天候は、画質に大きな影響を及ぼす可能性がある。本稿では, 降雨条件下での劣化画像を復元する, 知識誘導型シーンリカバリネットワーク(MvKSR)を提案する。
論文参考訳（メタデータ） (2024-01-08T10:41:45Z)
PAIF: Perception-Aware Infrared-Visible Image Fusion for Attack-Tolerant Semantic Segmentation [50.556961575275345]
対向シーンにおけるセグメンテーションの堅牢性を促進するための認識認識型融合フレームワークを提案する。我々は,先進の競争相手に比べて15.3% mIOUの利得で,ロバスト性を大幅に向上させることを示す。
論文参考訳（メタデータ） (2023-08-08T01:55:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。