論文の概要: R-Sparse R-CNN: SAR Ship Detection Based on Background-Aware Sparse Learnable Proposals
- arxiv url: http://arxiv.org/abs/2504.18959v1
- Date: Sat, 26 Apr 2025 15:50:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.067486
- Title: R-Sparse R-CNN: SAR Ship Detection Based on Background-Aware Sparse Learnable Proposals
- Title(参考訳): R-Sparse R-CNN:背景認識型スパース学習可能な提案に基づくSAR船の検出
- Authors: Kamirul Kamirul, Odysseas Pappas, Alin Achim,
- Abstract要約: R-Sparse R-CNNは,SAR(Synthetic Aperture Radar)画像における指向性船舶検出のための新しいパイプラインである。
スパースプロポーザルの採用により、重複する予測のための提案ジェネレータや後処理の必要性を排除し、パイプラインの合理化が図られる。
実験の結果,R-Sparse R-CNNの精度は最先端モデルを上回ることがわかった。
- 参考スコア(独自算出の注目度): 4.4173427917548524
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce R-Sparse R-CNN, a novel pipeline for oriented ship detection in Synthetic Aperture Radar (SAR) images that leverages sparse learnable proposals enriched with background contextual information, termed background-aware proposals (BAPs). The adoption of sparse proposals streamlines the pipeline by eliminating the need for proposal generators and post-processing for overlapping predictions. The proposed BAPs enrich object representation by integrating ship and background features, allowing the model to learn their contextual relationships for more accurate distinction of ships in complex environments. To complement BAPs, we propose Dual-Context Pooling (DCP), a novel strategy that jointly extracts ship and background features in a single unified operation. This unified design improves efficiency by eliminating redundant computation inherent in separate pooling. Moreover, by ensuring that ship and background features are pooled from the same feature map level, DCP provides aligned features that improve contextual relationship learning. Finally, as a core component of contextual relationship learning in R-Sparse R-CNN, we design a dedicated transformer-based Interaction Module. This module interacts pooled ship and background features with corresponding proposal features and models their relationships. Experimental results show that R-Sparse R-CNN delivers outstanding accuracy, surpassing state-of-the-art models by margins of up to 12.8% and 11.9% on SSDD and RSDD-SAR inshore datasets, respectively. These results demonstrate the effectiveness and competitiveness of R-Sparse R-CNN as a robust framework for oriented ship detection in SAR imagery. The code is available at: www.github.com/ka-mirul/R-Sparse-R-CNN.
- Abstract(参考訳): R-Sparse R-CNNはSAR(Synthetic Aperture Radar)画像において、背景文脈情報に富んだスパース学習可能な提案を生かし、背景認識提案(BAP)と呼ぶ。
スパースプロポーザルの採用により、重複する予測のための提案ジェネレータや後処理の必要性を排除し、パイプラインの合理化が図られる。
提案したBAPは、船と背景の特徴を統合することでオブジェクト表現を充実させ、複雑な環境における船のより正確な識別のために、モデルがそれらのコンテキスト関係を学習できるようにする。
BAPを補完するために,単一統合操作で船と背景の特徴を共同で抽出する新たな戦略であるDual-Context Pooling (DCP)を提案する。
この統一された設計は、分離したプールに固有の冗長な計算を排除して効率を向上する。
さらに、シップとバックグラウンドの機能が同じ機能マップレベルからプールされることを保証することで、DCPはコンテキスト関係学習を改善するための整列した機能を提供します。
最後に,R-Sparse R-CNNにおけるコンテキスト関係学習のコアコンポーネントとして,専用トランスフォーマベースインタラクションモジュールを設計する。
このモジュールは、プールされたシップとバックグラウンドの機能と対応する提案機能と相互作用し、それらの関係をモデル化する。
実験の結果、R-Sparse R-CNN は、SSDD と RSDD-SAR のインショアデータセットでそれぞれ 12.8% と 11.9% のマージンで最先端のモデルを上回っている。
これらの結果は,R-Sparse R-CNNのSAR画像における指向性船舶検出のための堅牢なフレームワークとしての有効性と競争性を示すものである。
コードは、www.github.com/ka-mirul/R-Sparse-R-CNNで入手できる。
関連論文リスト
- Sparse R-CNN OBB: Ship Target Detection in SAR Images Based on Oriented Sparse Proposals [4.4173427917548524]
本稿では,SAR(Synthetic Aperture Radar)画像中の指向性物体を検出するためのフレームワークであるSparse R-CNN OBBを提案する。
我々の知る限り、Sparse R-CNN OBBは、オブジェクト指向オブジェクトの検出にスパース学習可能な提案という概念を最初に採用しました。
Sparse R-CNN OBBは,沿岸および沖合の両方のシナリオにおいて,他のモデルを上回る優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-12T12:12:46Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Dual-stream contrastive predictive network with joint handcrafted
feature view for SAR ship classification [9.251342335645765]
本稿では,新しいデュアルストリームコントラスト予測ネットワーク(DCPNet)を提案する。
最初のタスクは正のサンプルペアを構築し、コアエンコーダにより一般的な表現を学習させることである。
第2の課題は, 深部特徴と手話特徴との対応を適応的に把握し, モデル内での知識伝達を実現し, 特徴融合による冗長性を効果的に改善することである。
論文 参考訳(メタデータ) (2023-11-26T05:47:01Z) - Learning Detail-Structure Alternative Optimization for Blind
Super-Resolution [69.11604249813304]
そこで我々は,ブラインドSRに先立ってカーネルを曖昧にすることなく,再帰的な詳細構造代替最適化を実現する,有効かつカーネルフリーなネットワークDSSRを提案する。
DSSRでは、細部構造変調モジュール(DSMM)が構築され、画像の詳細と構造の相互作用と協調を利用する。
本手法は既存の手法に対して最先端の手法を実現する。
論文 参考訳(メタデータ) (2022-12-03T14:44:17Z) - Hierarchical Spherical CNNs with Lifting-based Adaptive Wavelets for
Pooling and Unpooling [101.72318949104627]
本稿では, 階層型畳み込みニューラルネットワーク(HS-CNN)の新たな枠組みを提案し, プールやアンプールのための適応球面ウェーブレットを学習する。
LiftHS-CNNは、画像レベルのタスクとピクセルレベルのタスクの両方において、より効率的な階層的特徴学習を実現する。
論文 参考訳(メタデータ) (2022-05-31T07:23:42Z) - SAR-ShipNet: SAR-Ship Detection Neural Network via Bidirectional
Coordinate Attention and Multi-resolution Feature Fusion [7.323279438948967]
本稿では,ニューラルネットワークによる合成開口レーダ(SAR)画像から,事実上有意義な船舶検出問題について検討する。
本稿では,CentralNetに基づく双方向協調注意(BCA)とMRF(Multi- resolution Feature Fusion)を新たに開発したSAR-ShipNet(略してSAR-ShipNet)を提案する。
パブリックなSAR-Shipデータセットの実験結果から,SAR-ShipNetは速度と精度の両面で競争上の優位性を達成していることがわかった。
論文 参考訳(メタデータ) (2022-03-29T12:27:04Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Attention-based Multi-hypothesis Fusion for Speech Summarization [83.04957603852571]
音声認識(ASR)とテキスト要約(TS)を組み合わせることで、音声要約を実現することができる
ASR誤差はカスケード法における出力要約の品質に直接影響する。
本稿では、ASRの誤りに対して頑健なカスケード音声要約モデルを提案し、ASRが生成した複数の仮説を利用して、ASRの誤りが要約に与える影響を緩和する。
論文 参考訳(メタデータ) (2021-11-16T03:00:29Z) - AdaptiveWeighted Attention Network with Camera Spectral Sensitivity
Prior for Spectral Reconstruction from RGB Images [22.26917280683572]
スペクトル再構成のための適応重み付き注意ネットワーク(AWAN)を提案する。
AWCAおよびPSNLモジュールは、チャネルワイドな特徴応答を再配置するために開発された。
NTIRE 2020 Spectral Reconstruction Challengeでは、クリーントラックで1位、リアルワールドで3位を獲得しました。
論文 参考訳(メタデータ) (2020-05-19T09:21:01Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。