論文の概要: An Axiomatic Approach to Model-Agnostic Concept Explanations
- arxiv url: http://arxiv.org/abs/2401.06890v1
- Date: Fri, 12 Jan 2024 20:53:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 20:56:56.709647
- Title: An Axiomatic Approach to Model-Agnostic Concept Explanations
- Title(参考訳): モデル非依存概念説明への公理的アプローチ
- Authors: Zhili Feng, Michal Moshkovitz, Dotan Di Castro, J. Zico Kolter
- Abstract要約: 本稿では、線形性、再帰性、類似性という3つの自然な公理を満たす概念的説明へのアプローチを提案する。
次に、従来の概念的説明手法とのつながりを確立し、それらの意味の異なる意味についての洞察を提供する。
- 参考スコア(独自算出の注目度): 67.84000759813435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concept explanation is a popular approach for examining how
human-interpretable concepts impact the predictions of a model. However, most
existing methods for concept explanations are tailored to specific models. To
address this issue, this paper focuses on model-agnostic measures.
Specifically, we propose an approach to concept explanations that satisfy three
natural axioms: linearity, recursivity, and similarity. We then establish
connections with previous concept explanation methods, offering insight into
their varying semantic meanings. Experimentally, we demonstrate the utility of
the new method by applying it in different scenarios: for model selection,
optimizer selection, and model improvement using a kind of prompt editing for
zero-shot vision language models.
- Abstract(参考訳): 概念説明は、人間の解釈可能な概念がモデルの予測にどのように影響するかを調べる一般的なアプローチである。
しかし、既存の概念的説明法のほとんどは特定のモデルに合わせている。
この問題に対処するため,本稿ではモデル非依存の尺度について述べる。
具体的には、線形性、再帰性、類似性という3つの自然公理を満たす概念説明のアプローチを提案する。
次に,先行する概念説明手法との関連性を確立し,その意味的意味について考察する。
実験では,ゼロショット視覚言語モデルに対するプロンプト編集の一種を用いたモデル選択,オプティマイザ選択,モデル改善など,異なるシナリオで適用することで,新しい手法の有用性を実証する。
関連論文リスト
- Fast Explainability via Feasible Concept Sets Generator [7.011763596804071]
モデルに依存しないアプローチの普遍性とモデル固有のアプローチの効率とのギャップを埋める。
まず、人間の理解可能な概念の集合を通して説明を定義する。
第二に、予測モデルに付随する説明として、最小限の可能な集合生成器を学習できることが示される。
論文 参考訳(メタデータ) (2024-05-29T00:01:40Z) - Evaluating Readability and Faithfulness of Concept-based Explanations [35.48852504832633]
概念に基づく説明は、大規模言語モデルによって学習された高レベルのパターンを説明するための有望な道として現れます。
現在の手法は、統一的な形式化を欠いた異なる視点から概念にアプローチする。
これにより、概念の中核となる尺度、すなわち忠実さや可読性を評価するのが難しくなります。
論文 参考訳(メタデータ) (2024-04-29T09:20:25Z) - A survey on Concept-based Approaches For Model Improvement [2.1516043775965565]
概念は人間の思考基盤として知られている。
ディープニューラルネットワーク(DNN)における様々な概念表現とその発見アルゴリズムの体系的レビューと分類について述べる。
また,これらの手法を総合的に調査した最初の論文として,概念に基づくモデル改善文献について詳述する。
論文 参考訳(メタデータ) (2024-03-21T17:09:20Z) - On the Origins of Linear Representations in Large Language Models [51.88404605700344]
我々は,次のトークン予測の概念力学を定式化するために,単純な潜在変数モデルを導入する。
実験により、潜在変数モデルと一致するデータから学習すると線形表現が現れることが示された。
また、LLaMA-2大言語モデルを用いて、理論のいくつかの予測を検証した。
論文 参考訳(メタデータ) (2024-03-06T17:17:36Z) - Evaluating the Robustness of Interpretability Methods through
Explanation Invariance and Equivariance [72.50214227616728]
解釈可能性法は、それらの説明が説明されたモデルを忠実に記述した場合にのみ有用である。
特定の対称性群の下で予測が不変であるニューラルネットワークを考える。
論文 参考訳(メタデータ) (2023-04-13T17:59:03Z) - Concept Gradient: Concept-based Interpretation Without Linear Assumption [77.96338722483226]
概念活性化ベクトル(Concept Activation Vector, CAV)は、与えられたモデルと概念の潜在表現の間の線形関係を学習することに依存する。
我々は、線形概念関数を超えて概念に基づく解釈を拡張する概念グラディエント(CG)を提案した。
我々は、CGがおもちゃの例と実世界のデータセットの両方でCAVより優れていることを実証した。
論文 参考訳(メタデータ) (2022-08-31T17:06:46Z) - ConceptDistil: Model-Agnostic Distillation of Concept Explanations [4.462334751640166]
概念に基づく説明は、非技術的人間のためのモデルの解釈可能性ギャップを埋めることを目的としている。
知識蒸留を用いたブラックボックス分類器に概念記述をもたらす方法であるConceptDistilを提案する。
実世界のユースケースでConceptDistilを検証することで、両方のタスクを最適化できることを示す。
論文 参考訳(メタデータ) (2022-05-07T08:58:54Z) - Human-Centered Concept Explanations for Neural Networks [47.71169918421306]
概念活性化ベクトル(Concept Activation Vectors, CAV)のクラスを含む概念的説明を紹介する。
次に、自動的に概念を抽出するアプローチと、それらの注意事項に対処するアプローチについて議論する。
最後に、このような概念に基づく説明が、合成設定や実世界の応用において有用であることを示すケーススタディについて論じる。
論文 参考訳(メタデータ) (2022-02-25T01:27:31Z) - Beyond Trivial Counterfactual Explanations with Diverse Valuable
Explanations [64.85696493596821]
コンピュータビジョンの応用において、生成的対実法はモデルの入力を摂動させて予測を変更する方法を示す。
本稿では,多様性強化損失を用いて制約される不連続潜在空間における摂動を学習する反事実法を提案する。
このモデルは, 従来の最先端手法と比較して, 高品質な説明を生産する成功率を向上させる。
論文 参考訳(メタデータ) (2021-03-18T12:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。