論文の概要: Learning Object-Centric Representations in SAR Images with Multi-Level Feature Fusion
- arxiv url: http://arxiv.org/abs/2509.09298v1
- Date: Thu, 11 Sep 2025 09:42:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 16:52:24.321333
- Title: Learning Object-Centric Representations in SAR Images with Multi-Level Feature Fusion
- Title(参考訳): マルチレベル特徴融合によるSAR画像における物体中心表現の学習
- Authors: Oh-Tae Jang, Min-Gon Cho, Kyung-Tae Kim,
- Abstract要約: SlotSARは、マスクアノテーションなしでSARイメージの背景クラッタからターゲット表現をアンタングルする。
本稿では,これらの低レベル特徴と高レベル特徴を統合したマルチレベルスロットアテンションモジュールを提案する。
- 参考スコア(独自算出の注目度): 5.295349411568878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic aperture radar (SAR) images contain not only targets of interest but also complex background clutter, including terrain reflections and speckle noise. In many cases, such clutter exhibits intensity and patterns that resemble targets, leading models to extract entangled or spurious features. Such behavior undermines the ability to form clear target representations, regardless of the classifier. To address this challenge, we propose a novel object-centric learning (OCL) framework, named SlotSAR, that disentangles target representations from background clutter in SAR images without mask annotations. SlotSAR first extracts high-level semantic features from SARATR-X and low-level scattering features from the wavelet scattering network in order to obtain complementary multi-level representations for robust target characterization. We further present a multi-level slot attention module that integrates these low- and high-level features to enhance slot-wise representation distinctiveness, enabling effective OCL. Experimental results demonstrate that SlotSAR achieves state-of-the-art performance in SAR imagery by preserving structural details compared to existing OCL methods.
- Abstract(参考訳): 合成開口レーダ(SAR)画像は、興味の対象だけでなく、地形反射やスペックルノイズを含む複雑な背景散乱も含む。
多くの場合、そのようなクラッタはターゲットに類似した強度やパターンを示し、絡み合った、または刺激的な特徴を抽出するモデルとなる。
このような振る舞いは、分類器に関係なく、明確なターゲット表現を形成する能力を損なう。
この課題に対処するために,SlotSARと呼ばれる新しいオブジェクト指向学習(OCL)フレームワークを提案する。
SlotSARはまずSARATR-Xから高レベルな意味的特徴を抽出し、ウェーブレット散乱ネットワークから低レベルな散乱特徴を抽出し、ロバストなターゲットキャラクタリゼーションのための相補的な多レベル表現を得る。
さらに,これらの低レベル・高レベルの特徴を統合したマルチレベルスロットアテンションモジュールを提案する。
実験により,SlotSARは既存のOCL法と比較して構造的詳細を保存することにより,SAR画像の最先端性能を達成できることが示されている。
関連論文リスト
- Annotation-Free Open-Vocabulary Segmentation for Remote-Sensing Images [51.74614065919118]
本稿では,アノテーションのないRS画像のオープン語彙セグメンテーションのための最初のフレームワークであるSegEarth-OVを紹介する。
粗い特徴から高分解能空間の詳細を頑健に復元する普遍的なアップサンプラーであるSimFeatUpを提案する。
また、パッチ機能から固有のグローバルコンテキストを抽出するための、シンプルで効果的なグローバルバイアス緩和操作も提示する。
論文 参考訳(メタデータ) (2025-08-25T14:22:57Z) - Collaborative Learning of Scattering and Deep Features for SAR Target Recognition with Noisy Labels [7.324728751991982]
雑音ラベル付きSAR自動目標認識のための散乱・深度特徴の協調学習を提案する。
具体的には、散乱と深い特徴を統合するために、マルチモデル機能融合フレームワークが設計されている。
提案手法は,ラベルノイズの異なる動作条件下での最先端性能を実現することができる。
論文 参考訳(メタデータ) (2025-08-11T06:10:23Z) - SAR Object Detection with Self-Supervised Pretraining and Curriculum-Aware Sampling [41.24071764578782]
衛星搭載合成開口レーダ画像における物体検出は、都市モニタリングや災害対応といったタスクにおいて大きな可能性を秘めている。
衛星搭載SAR画像における小さな物体の検出は、比較的低い空間分解能と固有のノイズのため、特に複雑な問題を引き起こす。
本稿では,SARオブジェクト検出モデルであるTransARを紹介する。
論文 参考訳(メタデータ) (2025-04-17T19:44:05Z) - Bottom-Up Scattering Information Perception Network for SAR target recognition [9.694730272245849]
本稿では,より解釈可能なターゲット認識のためのボトムアップ散乱情報知覚ネットワークを提案する。
まず、CNNネットワークに基づくバックボーン特徴抽出器を置き換えるために、局所散乱パーセプトロンを提案する。
次に、対象散乱部情報を頑健に特徴付けるために、教師なし散乱部特徴抽出モデルを提案する。
第3に、対象部品の知識を集約して完全な対象記述を形成することにより、モデルの解釈可能性および識別能力を向上させる。
論文 参考訳(メタデータ) (2025-04-07T07:15:08Z) - Multitask Learning for SAR Ship Detection with Gaussian-Mask Joint Segmentation [20.540873039361102]
本稿では,オブジェクト検出,スペックル抑制,ターゲットセグメンテーションタスクからなるSAR船舶検出のためのマルチタスク学習フレームワークを提案する。
アスペクト比重み付けによる角度分類損失を導入し、角度周期性と物体比に対処して検出精度を向上させる。
スペックル抑制タスクはデュアルフュージョンアテンション機構を使用してノイズを低減し、浅くノイズを生じさせる特徴を融合させ、ロバスト性を高める。
ターゲットセグメンテーションタスクは、回転したガウスマスクを利用して、乱雑な背景から対象領域を抽出するネットワークを支援し、画素レベルの予測により検出効率を向上させる。
論文 参考訳(メタデータ) (2024-11-21T05:10:41Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Learning Efficient Representations for Enhanced Object Detection on
Large-scene SAR Images [16.602738933183865]
SAR(Synthetic Aperture Radar)画像のターゲットの検出と認識は難しい問題である。
近年開発されたディープラーニングアルゴリズムは,SAR画像の固有の特徴を自動的に学習することができる。
本稿では,効率的かつ堅牢なディープラーニングに基づくターゲット検出手法を提案する。
論文 参考訳(メタデータ) (2022-01-22T03:25:24Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。