論文の概要: Generating detailed saliency maps using model-agnostic methods
- arxiv url: http://arxiv.org/abs/2209.09202v1
- Date: Sun, 4 Sep 2022 21:34:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 17:40:20.928020
- Title: Generating detailed saliency maps using model-agnostic methods
- Title(参考訳): モデル非依存法による詳細な塩分マップの生成
- Authors: Maciej Sakowicz
- Abstract要約: 本稿では, モデルに依存しない RISE 法に着目し, グリッドベースアプローチの欠点を詳細に考察する。
VRISE (Voronoi-RISE) と呼ばれる修正は、大きなオクルージョンを用いて生成された地図の精度を向上させることを目的としている。
ILSVRC2012の検証分割において, VRISE と RISE が生成したサリエンシマップの精度を比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emerging field of Explainable Artificial Intelligence focuses on
researching methods of explaining the decision making processes of complex
machine learning models. In the field of explainability for Computer Vision,
explanations are provided as saliency maps, which visualize the importance of
individual pixels of the input w.r.t. the model's prediction. In this work we
focus on a perturbation-based, model-agnostic explainability method called
RISE, elaborate on observed shortcomings of its grid-based approach and propose
two modifications: replacement of square occlusions with convex polygonal
occlusions based on cells of a Voronoi mesh and addition of an informativeness
guarantee to the occlusion mask generator. These modifications, collectively
called VRISE (Voronoi-RISE), are meant to, respectively, improve the accuracy
of maps generated using large occlusions and accelerate convergence of saliency
maps in cases where sampling density is either very low or very high. We
perform a quantitative comparison of accuracy of saliency maps produced by
VRISE and RISE on the validation split of ILSVRC2012, using a saliency-guided
content insertion/deletion metric and a localization metric based on bounding
boxes. Additionally, we explore the space of configurable occlusion pattern
parameters to better understand their influence on saliency maps produced by
RISE and VRISE. We also describe and demonstrate two effects observed over the
course of experimentation, arising from the random sampling approach of RISE:
"feature slicing" and "saliency misattribution". Our results show that convex
polygonal occlusions yield more accurate maps for coarse occlusion meshes and
multi-object images, but improvement is not guaranteed in other cases. The
informativeness guarantee is shown to increase the convergence rate without
incurring a significant computational overhead.
- Abstract(参考訳): 説明可能な人工知能の新興分野は、複雑な機械学習モデルの意思決定プロセスを説明する方法の研究に焦点を当てている。
コンピュータビジョンにおける説明可能性の分野では、入力w.r.t.の個々のピクセルの重要性を可視化するサリエンシマップとして説明が提供される。
本研究は, RISEと呼ばれる摂動型モデル非依存的説明可能性法に着目し, グリッドベースアプローチの問題点を詳しく検討し, 正方形オクルージョンをボローニメッシュのセルに基づく凸多角形オクルージョンに置き換えることと, オクルージョンマスクジェネレータに情報性を保証することの2つの修正を提案する。
VRISE (Voronoi-RISE) と呼ばれるこれらの修正は、サンプリング密度が非常に低いか非常に高い場合において、大きなオクルージョンを用いて生成されたマップの精度を向上し、サリエンシマップの収束を加速することを目的としている。
ILSVRC2012の検証分割において, VRISE と RISE が生成したサリエンシマップの精度を定量的に比較し,サリエンシ誘導型コンテンツ挿入・削除基準とバウンディングボックスに基づくローカライゼーション基準を用いて比較した。
さらに,RISE と VRISE のサリエンシマップへの影響をよりよく理解するために,構成可能なオクルージョンパターンパラメータの空間について検討する。
また,実験の過程で観察された2つの効果を,「特徴スライシング」と「サリエンシー・ミスアトリビューション」のランダムサンプリングアプローチから説明し,実証した。
その結果,凸多角形オクルージョンは粗いオクルージョンメッシュや多対象画像に対してより正確なマップが得られるが,他の場合では改善は保証されない。
本報知性保証は、計算オーバーヘッドを負うことなく収束率を増加させることが示される。
関連論文リスト
- LGU-SLAM: Learnable Gaussian Uncertainty Matching with Deformable Correlation Sampling for Deep Visual SLAM [11.715999663401591]
学習可能な2次元ガウス不確実性モデルは、マッチングフレームペアを関連付けるように設計されている。
マルチスケールの変形可能な相関戦略を考案し、各方向のサンプリングを適応的に微調整する。
本手法の有効性と優位性を検証するために,実世界のデータセットと合成データセットの実験を行った。
論文 参考訳(メタデータ) (2024-10-30T17:20:08Z) - Learning Gaussian Representation for Eye Fixation Prediction [54.88001757991433]
既存のアイ固定予測方法は、入力画像から原固定点から生成された対応する濃密な固定マップへのマッピングを行う。
本稿ではアイフィグレーションモデリングのためのガウス表現について紹介する。
我々は,リアルタイムな固定予測を実現するために,軽量なバックボーン上にフレームワークを設計する。
論文 参考訳(メタデータ) (2024-03-21T20:28:22Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Fine-grained Classification of Solder Joints with {\alpha}-skew
Jensen-Shannon Divergence [0.0]
半田は特徴多様性が低く, きめ細かい画像分類作業として半田共同検査を行うことができることを示す。
詳細な分類精度を向上させるために,エントロピーの最大化による信頼度モデル予測が文献で有用であることがわかった。
提案手法は, きめ細かな半田関節分類タスクにおいて, 異なるモデルのF1スコアと競争精度を最大化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T17:06:51Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Statistical Outlier Identification in Multi-robot Visual SLAM using
Expectation Maximization [18.259478519717426]
本稿では、同時局所化およびマッピング(SLAM)におけるマップ間ループ閉包外乱検出のための、新しい分散手法を提案する。
提案アルゴリズムは優れた初期化に頼らず、一度に2つ以上のマップを処理できる。
論文 参考訳(メタデータ) (2020-02-07T06:34:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。