論文の概要: Combi-CAM: A Novel Multi-Layer Approach for Explainable Image Geolocalization
- arxiv url: http://arxiv.org/abs/2603.24117v1
- Date: Wed, 25 Mar 2026 09:29:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.225358
- Title: Combi-CAM: A Novel Multi-Layer Approach for Explainable Image Geolocalization
- Title(参考訳): Combi-CAM: 説明可能な画像ジオローカライゼーションのための新しいマルチレイヤアプローチ
- Authors: David Faget, José Luis Lisani, Miguel Colom,
- Abstract要約: 我々は,CNNに基づくジオローカライゼーションモデルの説明可能性を高める新しい手法であるCombi-CAMを提案する。
このアプローチは、異なる画像特徴がモデルの判断にどのように貢献するかについて、より詳細な理解を提供する。
- 参考スコア(独自算出の注目度): 0.5461938536945722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Planet-scale photo geolocalization involves the intricate task of estimating the geographic location depicted in an image purely based on its visual features. While deep learning models, particularly convolutional neural networks (CNNs), have significantly advanced this field, understanding the reasoning behind their predictions remains challenging. In this paper, we present Combi-CAM, a novel method that enhances the explainability of CNN-based geolocalization models by combining gradient-weighted class activation maps obtained from several layers of the network architecture, rather than using only information from the deepest layer as is typically done. This approach provides a more detailed understanding of how different image features contribute to the model's decisions, offering deeper insights than the traditional approaches.
- Abstract(参考訳): 惑星規模の写真測地は、その視覚的特徴に基づいて、画像に描かれた地理的な位置を推定する複雑な作業を含む。
ディープラーニングモデル、特に畳み込みニューラルネットワーク(CNN)はこの分野を著しく進歩させてきたが、それらの予測の背後にある理由を理解することは依然として困難である。
本稿では,ネットワークアーキテクチャの複数の層から得られる勾配重み付きクラスアクティベーションマップを組み合わせることで,CNNに基づくジオローカライゼーションモデルの説明可能性を高める手法であるCombi-CAMを提案する。
このアプローチは、異なるイメージ機能がモデルの判断にどのように貢献するかをより詳細に理解し、従来のアプローチよりも深い洞察を提供する。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Shap-CAM: Visual Explanations for Convolutional Neural Networks based on
Shapley Value [86.69600830581912]
クラスアクティベーションマッピングに基づくShap-CAMと呼ばれる新しい視覚的説明法を開発した。
我々は,Shap-CAMが意思決定プロセスの解釈において,より良い視覚的性能と公平性を実現することを実証した。
論文 参考訳(メタデータ) (2022-08-07T00:59:23Z) - Enhancing Deep Neural Network Saliency Visualizations with Gradual
Extrapolation [0.0]
Grad-CAMやExcit Backpropagationのようなクラスアクティベーションマッピング手法の拡張手法を提案する。
我々のアイデアはGradual Extrapolationと呼ばれ、出力をシャープすることでヒートマップ画像を生成するメソッドを補うことができる。
論文 参考訳(メタデータ) (2021-04-11T07:39:35Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Learning Local Complex Features using Randomized Neural Networks for
Texture Analysis [0.1474723404975345]
テクスチャ解析のための学習手法と複雑ネットワーク(CN)理論を組み合わせた新しい手法を提案する。
この方法はCNの表現能力を利用してテクスチャイメージを有向ネットワークとしてモデル化する。
このニューラルネットワークは、単一の隠蔽層を持ち、高速学習アルゴリズムを使用して、テクスチャのキャラクタリゼーションのためにローカルなCNパターンを学習することができる。
論文 参考訳(メタデータ) (2020-07-10T23:18:01Z) - Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。
得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。
最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文 参考訳(メタデータ) (2019-02-18T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。