論文の概要: ATCON: Attention Consistency for Vision Models
- arxiv url: http://arxiv.org/abs/2210.09705v1
- Date: Tue, 18 Oct 2022 09:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 15:08:37.368989
- Title: ATCON: Attention Consistency for Vision Models
- Title(参考訳): ATCON:ビジョンモデルのための注意一貫性
- Authors: Ali Mirzazadeh, Florian Dubost, Maxwell Pike, Krish Maniar, Max Zuo,
Christopher Lee-Messer, Daniel Rubin
- Abstract要約: 注意マップの整合性を改善する教師なしの微調整法を提案する。
Ablation studyではGrad-CAMおよびIntegrated Gradientsについて検討した。
これらの改良された注意マップは、臨床医が視覚モデル予測をよりよく理解するのに役立ちます。
- 参考スコア(独自算出の注目度): 0.8312466807725921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attention--or attribution--maps methods are methods designed to highlight
regions of the model's input that were discriminative for its predictions.
However, different attention maps methods can highlight different regions of
the input, with sometimes contradictory explanations for a prediction. This
effect is exacerbated when the training set is small. This indicates that
either the model learned incorrect representations or that the attention maps
methods did not accurately estimate the model's representations. We propose an
unsupervised fine-tuning method that optimizes the consistency of attention
maps and show that it improves both classification performance and the quality
of attention maps. We propose an implementation for two state-of-the-art
attention computation methods, Grad-CAM and Guided Backpropagation, which
relies on an input masking technique. We also show results on Grad-CAM and
Integrated Gradients in an ablation study. We evaluate this method on our own
dataset of event detection in continuous video recordings of hospital patients
aggregated and curated for this work. As a sanity check, we also evaluate the
proposed method on PASCAL VOC and SVHN. With the proposed method, with small
training sets, we achieve a 6.6 points lift of F1 score over the baselines on
our video dataset, a 2.9 point lift of F1 score on PASCAL, and a 1.8 points
lift of mean Intersection over Union over Grad-CAM for weakly supervised
detection on PASCAL. Those improved attention maps may help clinicians better
understand vision model predictions and ease the deployment of machine learning
systems into clinical care. We share part of the code for this article at the
following repository: https://github.com/alimirzazadeh/SemisupervisedAttention.
- Abstract(参考訳): attention-or attribution-maps method はモデル入力の領域を識別するために設計された手法である。
しかし、異なる注意マップ手法は入力の異なる領域をハイライトし、時には予測に矛盾する説明をする。
この効果は、トレーニングセットが小さいと悪化する。
これは、モデルが誤った表現を学習したか、注意マップ法がモデルの表現を正確に推定しなかったことを示している。
本研究では,アテンションマップの一貫性を最適化し,分類性能とアテンションマップの質を向上させるための教師なし微調整手法を提案する。
本稿では,入力マスキング技術に依存する2つの最先端注意計算手法であるGrad-CAMとGuid Backpropagationの実装を提案する。
また,Ablation studyにおいてGrad-CAMおよびIntegrated Gradientsについて検討した。
本研究のために集約・キュレーションされた病院患者の連続映像記録におけるイベント検出について,本手法を独自のデータセットで評価した。
正当性検査として,PASCAL VOCとSVHNについても提案手法の評価を行った。
提案手法では,ビデオデータセットのベースライン上でのF1スコアの6.6ポイント,PASCAL上でのF1スコアの2.9ポイント,Grad-CAM上での平均インターセクションの1.8ポイント,PASCAL上での弱い教師付き検出を行う。
これらの注意マップの改善は、臨床医が視覚モデルの予測を理解し、機械学習システムを臨床医療に展開しやすくするのに役立つかもしれない。
私たちは以下のリポジトリで、この記事のコードの一部を公開しています。
関連論文リスト
- Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - HomE: Homography-Equivariant Video Representation Learning [62.89516761473129]
マルチビュービデオの表現学習のための新しい手法を提案する。
提案手法は異なる視点間の暗黙的なマッピングを学習し,近隣の視点間のホモグラフィ関係を維持する表現空間を決定づける。
動作分類では,UCF101データセットの96.4%の3倍精度が得られた。
論文 参考訳(メタデータ) (2023-06-02T15:37:43Z) - Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。
本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。
本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-21T07:41:27Z) - Object Class Aware Video Anomaly Detection through Image Translation [1.2944868613449219]
本稿では、画像翻訳タスクを通して正常な外見と動きパターンを学習する2ストリームオブジェクト認識型VAD手法を提案する。
その結果,従来の手法の大幅な改善により,本手法による検出は完全に説明可能となり,異常はフレーム内で正確に局所化されることがわかった。
論文 参考訳(メタデータ) (2022-05-03T18:04:27Z) - Metrics for saliency map evaluation of deep learning explanation methods [0.0]
我々はPetsiukらによって提案された削除領域(DAUC)と挿入領域(IAUC)のメトリクスを批判的に分析する。
これらの指標はGrad-CAM や RISE といった一般的な手法によって生成されるサリエンシマップの忠実さを評価するために設計された。
本研究は,サリエンシマップによって与えられる実際のサリエンシスコア値が無視されることを示し,スコアのランキングのみを考慮した。
論文 参考訳(メタデータ) (2022-01-31T14:59:36Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Keep CALM and Improve Visual Feature Attribution [42.784665606132]
クラスアクティベーションマッピング(クラスアクティベーションマッピング、CAM)は、複数の視覚タスクのための特徴属性法の基礎となっている。
定式化における認識のためのキューの位置を符号化する潜在変数を明示的に組み込むことにより、CAMを改善する。
結果のモデルであるクラスアクティベーション潜在マッピング(CALM)は、期待最大化アルゴリズムを用いて訓練される。
論文 参考訳(メタデータ) (2021-06-15T03:33:25Z) - Visualization of Supervised and Self-Supervised Neural Networks via
Attribution Guided Factorization [87.96102461221415]
クラスごとの説明性を提供するアルゴリズムを開発した。
実験の広範なバッテリーでは、クラス固有の可視化のための手法の能力を実証する。
論文 参考訳(メタデータ) (2020-12-03T18:48:39Z) - Articulation-aware Canonical Surface Mapping [54.0990446915042]
本研究では,2次元画素から標準テンプレート形状の対応する点へのマッピングを示すCSM(Canonical Surface Mapping)を予測し,入力画像に対応するテンプレートの調音とポーズを推定するタスクに取り組む。
我々の重要な洞察は、これらのタスクは幾何学的に関連しており、予測間の一貫性を強制することで、監視信号を得ることができることである。
我々は,有意な調音学習において,調音がより正確なCSM予測の学習に役立ち,予測されたCSMとの整合性が重要であることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-01T17:56:45Z) - Uncertainty based Class Activation Maps for Visual Question Answering [30.859101872119517]
本稿では,視覚的注意マップを提供する勾配に基づく確実性推定手法を提案する。
我々は,これらの推定値の勾配を用いて,より改良した現代確率的ディープラーニング手法を取り入れた。
提案手法は,深層学習モデルの精度向上と説明のためのレシピとみなすことができる。
論文 参考訳(メタデータ) (2020-01-23T19:54:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。