論文の概要: A multi-weight self-matching visual explanation for cnns on sar images
- arxiv url: http://arxiv.org/abs/2512.02344v1
- Date: Tue, 02 Dec 2025 02:31:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.690788
- Title: A multi-weight self-matching visual explanation for cnns on sar images
- Title(参考訳): サー画像上のcnnの多重自己マッチング視覚的説明
- Authors: Siyuan Sun, Yongping Zhang, Hongcheng Zeng, Yamin Wang, Wei Yang, Wanting Yang, Jie Chen,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は、様々な合成開口レーダ(SAR)タスクで大きな成功を収めている。
MS-CAMは、SAR画像と、CNNが抽出した特徴マップと対応する勾配とをマッチングする。
自己構築型SARターゲット分類データセットで行った実験は、MS-CAMがネットワークの関心領域をより正確に強調していることを示している。
- 参考スコア(独自算出の注目度): 13.15276250657397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, convolutional neural networks (CNNs) have achieved significant success in various synthetic aperture radar (SAR) tasks. However, the complexity and opacity of their internal mechanisms hinder the fulfillment of high-reliability requirements, thereby limiting their application in SAR. Improving the interpretability of CNNs is thus of great importance for their development and deployment in SAR. In this paper, a visual explanation method termed multi-weight self-matching class activation mapping (MS-CAM) is proposed. MS-CAM matches SAR images with the feature maps and corresponding gradients extracted by the CNN, and combines both channel-wise and element-wise weights to visualize the decision basis learned by the model in SAR images. Extensive experiments conducted on a self-constructed SAR target classification dataset demonstrate that MS-CAM more accurately highlights the network's regions of interest and captures detailed target feature information, thereby enhancing network interpretability. Furthermore, the feasibility of applying MS-CAM to weakly-supervised obiect localization is validated. Key factors affecting localization accuracy, such as pixel thresholds, are analyzed in depth to inform future work.
- Abstract(参考訳): 近年、畳み込みニューラルネットワーク(CNN)は様々な合成開口レーダ(SAR)タスクで大きな成功を収めている。
しかし、それらの内部機構の複雑さと不透明さは、高い信頼性の要求を満たすことを妨げるため、SARでの応用を制限する。
したがって、CNNの解釈可能性を改善することは、SARにおける開発とデプロイにおいて非常に重要である。
本稿では,マルチウェイト・セルフマッチング・クラス・アクティベーション・マッピング(MS-CAM)と呼ばれる視覚的説明法を提案する。
MS-CAMは、SAR画像とCNNが抽出した特徴マップと対応する勾配とをマッチングし、チャネルワイドと要素ワイドの重みを組み合わせ、SAR画像のモデルで得られた決定基準を視覚化する。
自己構築型SARターゲット分類データセットで実施された大規模な実験により、MS-CAMはネットワークの関心領域をより正確に強調し、詳細なターゲット特徴情報をキャプチャし、ネットワークの解釈可能性を高める。
さらに,MS-CAMを弱制御オビオクテクト局在化に適用する可能性が検証された。
画素閾値などの局所化精度に影響を及ぼす要因を深く分析し,今後の課題について報告する。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - RSI-Net: Two-Stream Deep Neural Network Integrating GCN and Atrous CNN
for Semantic Segmentation of High-resolution Remote Sensing Images [3.468780866037609]
本稿では,リモートセンシング画像(RSI-Net)のセマンティックセグメンテーションのための2ストリームディープニューラルネットワークを提案する。
実験はVayhingen、Potsdam、Gaofen RSIデータセットで実施されている。
その結果,6つの最先端RSIセマンティックセグメンテーション法と比較して,総合的精度,F1スコア,カッパ係数において,RSI-Netの優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-19T15:57:20Z) - SS-CAM: Smoothed Score-CAM for Sharper Visual Feature Localization [1.3381749415517021]
SS-CAMと呼ばれる視覚的シャープネスの観点から,視覚的説明が強化された。
In the ILSVRC 2012 Validation dataset, which are evaluations Score-CAM on both faithfulness and localization task。
論文 参考訳(メタデータ) (2020-06-25T08:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。