論文の概要: Concept-Based Abductive and Contrastive Explanations for Behaviors of Vision Models
- arxiv url: http://arxiv.org/abs/2605.06640v1
- Date: Thu, 07 May 2026 17:51:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:12.061533
- Title: Concept-Based Abductive and Contrastive Explanations for Behaviors of Vision Models
- Title(参考訳): 視覚モデルの行動に対する概念に基づく帰納的・コントラスト的説明
- Authors: Ronaldo Canizales, Divya Gopinath, Corina Păsăreanu, Ravi Mangal,
- Abstract要約: 因果関係を確立するために *concept erasure* プロシージャを使用しながら,すべての最小説明を列挙するアルゴリズム群を提案する。
我々は、複数のモデル、データセット、行動に対するアプローチを評価し、そのコンピューティングにおける有効性を示し、ユーザフレンドリな説明を行う。
- 参考スコア(独自算出の注目度): 0.9881300744154826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: *Concept-based explanations* offer a promising approach for explaining the predictions of deep neural networks in terms of high-level, human-understandable concepts. However, existing methods either do not establish a causal connection between the concepts and model predictions or are limited in expressivity and only able to infer causal explanations involving single concepts. At the same time, the parallel line of work on *formal abductive and contrastive explanations* computes the minimal set of input features causally relevant for model outcomes but only considers low-level features such as pixels. Merging these two threads, in this work, we propose the notion of *concept-based abductive and contrastive explanations* that capture the minimal sets of high-level concepts causally relevant for model outcomes. We then present a family of algorithms that enumerate all minimal explanations while using *concept erasure* procedures to establish causal relationships. By appropriately aggregating such explanations, we are not only able to understand model predictions on individual images but also on collections of images where the model exhibits a user-specified, common *behavior*. We evaluate our approach on multiple models, datasets, and behaviors, and demonstrate its effectiveness in computing helpful, user-friendly explanations.
- Abstract(参考訳): *概念に基づく説明*は、深いニューラルネットワークの予測を、高レベルで人間に理解可能な概念の観点から説明するための有望なアプローチを提供する。
しかし、既存の手法は、概念とモデル予測の間の因果関係を確立していないか、表現性に制限があるか、単一の概念を含む因果的説明しか推論できない。
同時に、*形式的帰納的かつ対照的な説明に関する平行線の作業*は、モデル結果に因果的に関係する最小限の入力特徴集合を計算するが、ピクセルのような低レベルの特徴のみを考慮する。
この2つのスレッドを組み合わせることで、モデルの結果に因果関係のある最小レベルの概念を捉える*概念ベースの導出的かつ対照的な説明*の概念が提案される。
次に, 因果関係を確立するために *concept erasure* プロシージャを使用しながら, 最小限の説明を列挙するアルゴリズム群を提案する。
このような説明を適切に集約することにより、個々の画像上のモデル予測だけでなく、モデルがユーザ指定の一般的な *behavior* を示す画像の集合についても理解することができる。
我々は、複数のモデル、データセット、行動に対するアプローチを評価し、そのコンピューティングにおける有効性を示し、ユーザフレンドリな説明を行う。
関連論文リスト
- FaCT: Faithful Concept Traces for Explaining Neural Network Decisions [56.796533084868884]
ディープネットワークは、幅広いタスクで顕著なパフォーマンスを示しているが、それらの機能に関するグローバルな概念レベルの理解は、依然として重要な課題である。
本稿では,概念に基づく説明の忠実さを強調し,モデル独立な機械的概念説明を用いた新しいモデルを提案する。
私たちの概念はクラス間で共有され、あらゆるレイヤから、ロジットへの貢献と入力-視覚化を忠実にトレースすることができます。
論文 参考訳(メタデータ) (2025-10-29T13:35:46Z) - I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data? [76.15163242945813]
大規模言語モデル (LLM) は、多くの人が知能の形式を示すと結論づけている。
本稿では,潜在離散変数として表現される人間解釈可能な概念に基づいてトークンを生成する新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2025-03-12T01:21:17Z) - DiConStruct: Causal Concept-based Explanations through Black-Box
Distillation [9.735426765564474]
本稿では,概念ベースと因果性の両方を考慮した説明手法であるDiConStructを提案する。
本報告では, ブラックボックス機械学習モデルに対する蒸留モデルとして, その予測を近似し, それぞれの説明を生成する。
論文 参考訳(メタデータ) (2024-01-16T17:54:02Z) - An Axiomatic Approach to Model-Agnostic Concept Explanations [67.84000759813435]
本稿では、線形性、再帰性、類似性という3つの自然な公理を満たす概念的説明へのアプローチを提案する。
次に、従来の概念的説明手法とのつながりを確立し、それらの意味の異なる意味についての洞察を提供する。
論文 参考訳(メタデータ) (2024-01-12T20:53:35Z) - Learning with Explanation Constraints [91.23736536228485]
我々は、説明がモデルの学習をどのように改善するかを分析するための学習理論フレームワークを提供する。
我々は,多数の合成および実世界の実験に対して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T15:06:47Z) - Human-Centered Concept Explanations for Neural Networks [47.71169918421306]
概念活性化ベクトル(Concept Activation Vectors, CAV)のクラスを含む概念的説明を紹介する。
次に、自動的に概念を抽出するアプローチと、それらの注意事項に対処するアプローチについて議論する。
最後に、このような概念に基づく説明が、合成設定や実世界の応用において有用であることを示すケーススタディについて論じる。
論文 参考訳(メタデータ) (2022-02-25T01:27:31Z) - The Struggles of Feature-Based Explanations: Shapley Values vs. Minimal
Sufficient Subsets [61.66584140190247]
機能に基づく説明は、自明なモデルでも問題を引き起こすことを示す。
そこで本研究では,2つの一般的な説明書クラスであるシェープリー説明書と十分最小限の部分集合説明書が,基本的に異なる基底的説明書のタイプをターゲットにしていることを示す。
論文 参考訳(メタデータ) (2020-09-23T09:45:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。