論文の概要: COSE: A Consistency-Sensitivity Metric for Saliency on Image
Classification
- arxiv url: http://arxiv.org/abs/2309.10989v1
- Date: Wed, 20 Sep 2023 01:06:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 17:44:25.117067
- Title: COSE: A Consistency-Sensitivity Metric for Saliency on Image
Classification
- Title(参考訳): COSE:画像分類のための一貫性感度指標
- Authors: Rangel Daroya, Aaron Sun, Subhransu Maji
- Abstract要約: 本稿では,画像分類タスクにおいて,視覚の先行値を用いてサリエンシ手法の性能を評価する指標について述べる。
しかし,ほとんどの手法では,畳み込みモデルよりもトランスフォーマーモデルの方がよく説明できる。
- 参考スコア(独自算出の注目度): 21.3855970055692
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a set of metrics that utilize vision priors to effectively assess
the performance of saliency methods on image classification tasks. To
understand behavior in deep learning models, many methods provide visual
saliency maps emphasizing image regions that most contribute to a model
prediction. However, there is limited work on analyzing the reliability of
saliency methods in explaining model decisions. We propose the metric
COnsistency-SEnsitivity (COSE) that quantifies the equivariant and invariant
properties of visual model explanations using simple data augmentations.
Through our metrics, we show that although saliency methods are thought to be
architecture-independent, most methods could better explain transformer-based
models over convolutional-based models. In addition, GradCAM was found to
outperform other methods in terms of COSE but was shown to have limitations
such as lack of variability for fine-grained datasets. The duality between
consistency and sensitivity allow the analysis of saliency methods from
different angles. Ultimately, we find that it is important to balance these two
metrics for a saliency map to faithfully show model behavior.
- Abstract(参考訳): 本稿では,画像分類タスクにおけるサリエンシー法の性能を効果的に評価するために,視覚先行を用いたメトリクスセットを提案する。
深層学習モデルの振る舞いを理解するために、多くの手法がモデル予測に最も寄与する画像領域を強調するビジュアル・サリエンシ・マップを提供する。
しかし,モデル決定を説明する際,サリエンシー法の信頼性を分析する作業は限られている。
本稿では,単純なデータ拡張を用いた視覚モデル説明の同変特性と不変特性を定量化する指標として,COSE(Consistency-Sensitivity)を提案する。
提案手法はアーキテクチャに依存しないと考えられるが,ほとんどの手法では畳み込みモデルよりもトランスフォーマーモデルを説明する方がよい。
さらに、GradCAMはCOSEの点で他の手法よりも優れていることが判明したが、細粒度データセットの変動性の欠如などの制限があることが判明した。
一貫性と感度の双対性は、異なる角度からの塩分分析を可能にする。
最終的に、モデルの振る舞いを忠実に示すために、この2つのメトリクスのバランスをとることが重要であることに気付きます。
関連論文リスト
- Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Intriguing Differences Between Zero-Shot and Systematic Evaluations of
Vision-Language Transformer Models [7.360937524701675]
トランスフォーマーベースのモデルは、ベンチマークデータセットにおける優れた(ゼロショット)パフォーマンスのために、ここ数年で自然言語処理やその他の領域を支配してきた。
本稿では,新しい勾配勾配勾配最適化法に基づいて,一般的に使用される視覚言語モデルの埋め込み空間を探索する。
Imagenetteデータセットを用いて、モデルが99%以上のゼロショット分類性能を達成する一方で、体系的な評価を完全に失敗することを示した。
論文 参考訳(メタデータ) (2024-02-13T14:07:49Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - IMACS: Image Model Attribution Comparison Summaries [16.80986701058596]
我々は,勾配に基づくモデル属性とアグリゲーションと可視化技術を組み合わせたIMACSを提案する。
IMACSは評価データセットから適切な入力特徴を抽出し、類似性に基づいてクラスタ化し、類似した入力特徴に対するモデル属性の違いを可視化する。
本稿では,衛星画像上で訓練した2つのモデル間の領域シフトによる行動差を明らかにする方法を示す。
論文 参考訳(メタデータ) (2022-01-26T21:35:14Z) - Distributional Depth-Based Estimation of Object Articulation Models [21.046351215949525]
本研究では,奥行き画像から直接,調音モデルパラメータの分布を効率よく学習する手法を提案する。
私たちのコアコントリビューションには、剛体変換に対する分布の新しい表現が含まれています。
本稿では,カテゴリに依存しない調音モデル推定を行う新しい深層学習手法DUST-netを提案する。
論文 参考訳(メタデータ) (2021-08-12T17:44:51Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - Towards Visually Explaining Similarity Models [29.704524987493766]
本稿では,画像類似度予測のための勾配に基づく視覚的注意を生成する手法を提案する。
学習した機能の埋め込みにのみ依存することにより、我々のアプローチがCNNベースの類似性アーキテクチャのあらゆる種類に適用可能であることを示す。
得られたアテンションマップは、単に解釈可能性だけでなく、新たなトレーニング可能な制約でモデル学習プロセス自体に注入可能であることを示す。
論文 参考訳(メタデータ) (2020-08-13T17:47:41Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。