Fugu-MT 論文翻訳(概要): Prompting Foundation Models for Zero-Shot Ship Instance Segmentation in SAR Imagery

論文の概要: Prompting Foundation Models for Zero-Shot Ship Instance Segmentation in SAR Imagery

arxiv url: http://arxiv.org/abs/2604.17920v1
Date: Mon, 20 Apr 2026 07:57:11 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-21 21:52:52.755178
Title: Prompting Foundation Models for Zero-Shot Ship Instance Segmentation in SAR Imagery
Title（参考訳）: SAR画像におけるゼロショット船体セグメンテーションの基礎モデル
Authors: Islam Mansour, Francescopaolo Sica, Michael Schmitt,
Abstract要約: 本稿では,SAR(Synthetic Aperture Radar)画像において,汎用視覚基盤モデルがゼロショット船のインスタンスセグメンテーションを可能にする方法について検討する。オープンなSARデータセットに基づいてトレーニングされたYOLOv11ベースの検出器は、バウンディングボックスを介して船をローカライズし、Segment Anything Model 2 (SAM2) にインスタンスマスクを生成する。従来のSAMベースのSARアプローチとは異なり,SAR学習検出器の空間的制約だけで基礎モデル予測を効果的に正則化できることを本手法は示している。
参考スコア（独自算出の注目度）: 4.3991363299650335
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Synthetic Aperture Radar (SAR) plays a critical role in maritime surveillance, yet deep learning for SAR analysis is limited by the lack of pixel-level annotations. This paper explores how general-purpose vision foundation models can enable zero-shot ship instance segmentation in SAR imagery, eliminating the need for pixel-level supervision. A YOLOv11-based detector trained on open SAR datasets localizes ships via bounding boxes, which then prompt the Segment Anything Model 2 (SAM2) to produce instance masks without any mask annotations. Unlike prior SAM-based SAR approaches that rely on fine tuning or adapters, our method demonstrates that spatial constraints from a SAR-trained detector alone can effectively regularize foundation model predictions. This design partially mitigates the optical-SAR domain gap and enables downstream applications such as vessel classification, size estimation, and wake analysis. Experiments on the SSDD benchmark achieve a mean IoU of 0.637 (89% of a fully supervised baseline) with an overall ship detection rate of 89.2%, confirming a scalable, annotation-efficient pathway toward foundation-model-driven SAR image understanding.
Abstract（参考訳）: SAR(Synthetic Aperture Radar)は海洋監視において重要な役割を担っているが、SAR分析の深層学習はピクセルレベルのアノテーションの欠如によって制限される。本稿では,汎用視覚基盤モデルを用いて,SAR画像におけるゼロショット船のインスタンスセグメンテーションを実現し,画素レベルの監視の必要性を解消する方法について検討する。オープンなSARデータセットに基づいてトレーニングされたYOLOv11ベースの検出器は、バウンディングボックスを介して船をローカライズし、セグメンツ・アセシング・モデル2(SAM2)にマスクアノテーションを使わずにインスタンスマスクを生成する。従来のSAMベースのSARアプローチとは異なり,SAR学習検出器の空間的制約だけで基礎モデル予測を効果的に正則化できることを本手法は示している。この設計は、光学SAR領域のギャップを部分的に軽減し、船舶分類、サイズ推定、ウェイク解析などの下流アプリケーションを可能にする。 SSDDベンチマークの実験では、平均IoUは0.637(完全な教師付きベースラインの89%)であり、全体の船体検出率は89.2%であり、基礎モデル駆動のSAR画像理解への拡張性、アノテーション効率の良い経路が確認されている。

関連論文リスト

CrossEarth-SAR: A SAR-Centric and Billion-Scale Geospatial Foundation Model for Domain Generalizable Semantic Segmentation [51.94680303125737]
我々は、新しい物理誘導型スパース・オブ・エキスパート(MoE)アーキテクチャに基づいて構築された、最初の10億ドル規模のSARビジョン基盤モデルであるCrossEarth-SARを紹介する。大規模な事前トレーニングを容易にするために,公共およびプライベートなSAR画像を統合する弱く完全に教師付きデータセットであるCrossEarth-SAR-200Kを開発した。また、8つの異なる領域ギャップをまたいだ22のサブベンチマークからなるベンチマークスイートを導入し、SAR画像上でのドメイン一般化セマンティックセマンティックセグメンテーションのための最初の統一標準を確立した。
論文参考訳（メタデータ） (2026-03-12T14:52:35Z)
Annotation-Free Open-Vocabulary Segmentation for Remote-Sensing Images [51.74614065919118]
本稿では,アノテーションのないRS画像のオープン語彙セグメンテーションのための最初のフレームワークであるSegEarth-OVを紹介する。粗い特徴から高分解能空間の詳細を頑健に復元する普遍的なアップサンプラーであるSimFeatUpを提案する。また、パッチ機能から固有のグローバルコンテキストを抽出するための、シンプルで効果的なグローバルバイアス緩和操作も提示する。
論文参考訳（メタデータ） (2025-08-25T14:22:57Z)
SARATR-X: Toward Building A Foundation Model for SAR Target Recognition [22.770010893572973]
SAR ATRの基盤モデル構築に向けた最初の試みをSARATR-Xと呼ぶ。 SARATR-Xは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応のための基盤を提供する。 SARATR-Xは0.18Mの未ラベルのSARターゲットサンプルで訓練されており、これは同時代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
論文参考訳（メタデータ） (2024-05-15T14:17:44Z)
SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文参考訳（メタデータ） (2024-03-11T09:20:40Z)
Non-Visible Light Data Synthesis and Application: A Case Study for Synthetic Aperture Radar Imagery [30.590315753622132]
非可視光領域における安定拡散やイメージnのような大規模事前学習画像生成モデルの「隠れ」能力について検討する。 2段階の低ランク適応法を提案し,これを2LoRAと呼ぶ。第1段階では、構造がSARと一致する空中視正則画像データを用いてモデルを適応させ、続いて第1段階からのベースモデルをSARモダリティデータによりさらに適応させる第2段階とする。
論文参考訳（メタデータ） (2023-11-29T09:48:01Z)
Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.375515181854254]
SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。 SSLはデータから直接監視信号を構築することを目的としている。本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文参考訳（メタデータ） (2023-11-26T01:05:55Z)
Context-Preserving Instance-Level Augmentation and Deformable Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文参考訳（メタデータ） (2022-02-14T07:01:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。