論文の概要: LEMMA: Laplacian pyramids for Efficient Marine SeMAntic Segmentation
- arxiv url: http://arxiv.org/abs/2603.25689v1
- Date: Thu, 26 Mar 2026 17:38:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.406181
- Title: LEMMA: Laplacian pyramids for Efficient Marine SeMAntic Segmentation
- Title(参考訳): LEMMA(Laplacian pyramids for Efficient Marine Semantic Segmentation)
- Authors: Ishaan Gakhar, Laven Srivastava, Sankarshanaa Sagaram, Aditya Kasliwal, Ujjwal Verma,
- Abstract要約: 資源制約下での正確なリモートセンシングセグメンテーションのための,軽量なセマンティックセグメンテーションモデル LEMMA を提案する。
LeMMAは特徴抽出プロセスの初期にエッジ情報を統合し、モデルのサイズ、複雑さ、推論時間を劇的に削減する。
LeMMAは、さまざまなプラットフォームから取得したデータセット間の最先端のパフォーマンスをデモする。
- 参考スコア(独自算出の注目度): 7.753233602510338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation in marine environments is crucial for the autonomous navigation of unmanned surface vessels (USVs) and coastal Earth Observation events such as oil spills. However, existing methods, often relying on deep CNNs and transformer-based architectures, face challenges in deployment due to their high computational costs and resource-intensive nature. These limitations hinder the practicality of real-time, low-cost applications in real-world marine settings. To address this, we propose LEMMA, a lightweight semantic segmentation model designed specifically for accurate remote sensing segmentation under resource constraints. The proposed architecture leverages Laplacian Pyramids to enhance edge recognition, a critical component for effective feature extraction in complex marine environments for disaster response, environmental surveillance, and coastal monitoring. By integrating edge information early in the feature extraction process, LEMMA eliminates the need for computationally expensive feature map computations in deeper network layers, drastically reducing model size, complexity and inference time. LEMMA demonstrates state-of-the-art performance across datasets captured from diverse platforms while reducing trainable parameters and computational requirements by up to 71x, GFLOPs by up to 88.5\%, and inference time by up to 84.65\%, as compared to existing models. Experimental results highlight its effectiveness and real-world applicability, including 93.42\% IoU on the Oil Spill dataset and 98.97\% mIoU on Mastr1325.
- Abstract(参考訳): 海洋環境におけるセマンティックセグメンテーションは、無人表面船(USV)の自律航法や、石油流出などの沿岸地球観測イベントに不可欠である。
しかし、既存の手法は、しばしば深いCNNとトランスフォーマーベースのアーキテクチャに依存しており、高い計算コストとリソース集約性のために、デプロイメントの課題に直面している。
これらの制限は、現実世界の海洋環境におけるリアルタイムで低コストな応用の実践性を妨げている。
そこで本稿では,資源制約下での正確なリモートセンシングセグメンテーションのために設計された,軽量なセグメンテーションモデル LEMMA を提案する。
提案アーキテクチャは, 災害対応, 環境監視, 沿岸モニタリングのための複雑な海洋環境において, 効率的な特徴抽出のための重要な要素であるエッジ認識を強化するために, ラプラシアピラミドを利用する。
特徴抽出プロセスの早期にエッジ情報を統合することにより、LEMMAはより深いネットワーク層における計算コストの高い特徴マップ計算の必要性を排除し、モデルサイズ、複雑さ、推論時間を劇的に削減する。
LEMMAは、さまざまなプラットフォームから取得したデータセットの最先端性能を実証し、トレーニング可能なパラメータと計算要求を最大71倍、GFLOPを最大88.5倍、推論時間を最大84.65倍まで削減する。
実験結果は、オイルスピルデータセット上の93.42\% IoU、Mastr1325上の98.97\% mIoUなど、その有効性と実世界の適用性を強調している。
関連論文リスト
- Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation [9.012656001399952]
IoUT(Internet of Underwater Things)は、海洋観測、海洋資源管理、気候科学の重要な基盤となっている。
その発達は、厳しい音響減衰、地球上の無線システムよりもはるかに遅れた伝播、厳格なエネルギー制約、海流によって形成された動的トポロジーによって妨げられている。
機械学習は、これらの制限に対処するための重要な手段として現れ、水中無線センサネットワークの全層にわたるパフォーマンスを高めるデータ駆動メカニズムを提供する。
論文 参考訳(メタデータ) (2026-03-08T01:54:35Z) - RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation [51.37553739930992]
RPCANet++は、RPCAの解釈可能性と効率的なディープアーキテクチャを融合したスパースオブジェクトセグメンテーションフレームワークである。
我々のアプローチは、緩やかなRPCAモデルを背景近似モジュール(BAM)、対象抽出モジュール(OEM)、画像復元モジュール(IRM)からなる構造化ネットワークに展開する。
さまざまなデータセットの実験では、RPCANet++がさまざまなイメージングシナリオの下で最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2025-08-06T08:19:37Z) - ReconMOST: Multi-Layer Sea Temperature Reconstruction with Observations-Guided Diffusion [48.540756751934836]
ReconMOSTは多層水温再構築のためのデータ駆動誘導拡散モデルフレームワークである。
提案手法はMLベースのSST再構成をグローバルな多層設定に拡張し,92.5%以上の欠落データを処理する。
論文 参考訳(メタデータ) (2025-06-12T06:27:22Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition [5.667043618885205]
海中マルチシーン認識は知的海洋ロボットの能力向上に不可欠である。
MLLM(Multimodal Large Language Model)により生成された画像データ、テキスト記述、分類ベクトルを統合する。
我々のモデルは98$%の精度を達成し、以前のSOTAモデルを3.5$%の精度で上回っている。
この研究は、リアルタイムな海洋環境認識のための高性能なソリューションを提供し、リソース制限された環境での環境モニタリングと災害対応を自律表面車両(ASV)がサポートできるようにする。
論文 参考訳(メタデータ) (2025-03-10T06:47:38Z) - A feature refinement module for light-weight semantic segmentation network [11.285793559719702]
本稿では,軽量ネットワークのセマンティック情報を得る能力を向上させるために,新しいセマンティックセマンティックセマンティクス手法を提案する。
Cityscapes と Bdd100K のデータセットを用いて,提案手法が精度と計算コストのトレードオフを期待できることを示す。
論文 参考訳(メタデータ) (2024-12-11T03:31:20Z) - Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.468621550644668]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している
海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。
既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文 参考訳(メタデータ) (2024-07-12T05:48:53Z) - Real-time Semantic Segmentation with Fast Attention [94.88466483540692]
本稿では,高解像度画像と映像をリアルタイムにセマンティックセグメンテーションするための新しいアーキテクチャを提案する。
提案したアーキテクチャは我々の空間的注意の速さに依存しており、これは一般的な自己注意機構の単純かつ効率的な修正である。
複数のデータセットに対する結果から,既存の手法に比べて精度と速度が向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-07T22:37:16Z) - Real-time Semantic Segmentation via Spatial-detail Guided Context
Propagation [49.70144583431999]
本研究では,リアルタイムセマンティックセグメンテーションを実現するための空間詳細ガイド付きコンテキスト伝搬ネットワーク(SGCPNet)を提案する。
浅い層の空間的詳細を利用して低解像度のグローバルコンテキストの伝播を誘導し、失われた空間情報を効果的に再構成することができる。
69.5%のmIoUセグメンテーション精度を実現し、GeForce GTX 1080 Tiの768x1536イメージ上で178.5 FPSに達する。
論文 参考訳(メタデータ) (2020-05-22T07:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。