論文の概要: $α$-TCAV: A Unified Framework for Testing with Concept Activation Vectors
- arxiv url: http://arxiv.org/abs/2605.15688v1
- Date: Fri, 15 May 2026 07:22:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.307973
- Title: $α$-TCAV: A Unified Framework for Testing with Concept Activation Vectors
- Title(参考訳): $α$-TCAV:概念アクティベーションベクトルでテストするための統一フレームワーク
- Authors: Ekkehard Schnoor, Jawher Said, Malik Tiomoko, Wojciech Samek, Alexander Jung,
- Abstract要約: 概念ベクトル (Concept Vectors, CAV) は、ディープラーニングにおける概念ベースの説明可能性のためのツールである。
CAV と CAV 法による Activation Testing (TCAV) を解析した。
パラメータ化スムーズな関数でインジケータを置き換える汎用フレームワークである$-TCAVを導入する。
- 参考スコア(独自算出の注目度): 55.54306267760148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concept Activation Vectors (CAVs) are a fundamental tool for concept-based explainability in deep learning, yet their practical utility is limited by statistical instability. We analyze the stochastic nature of CAVs and the Testing with CAVs (TCAV) method, deriving the distributions of major CAV classes including PatternCAV, FastCAV, and ridge regression-based CAVs. We then identify a fundamental flaw in the standard TCAV score: its reliance on a discontinuous indicator function induces non-decaying variance in critical regimes. To address this, we introduce $α$-TCAV, a generalized framework that replaces the indicator with a parameterized smooth function, yielding a unified probabilistic formulation that subsumes both TCAV and Multi-TCAV. We characterize the induced distributions of sensitivity scores and different TCAV variants, showing that established state-of-the-art choices lack theoretical justification. We provide principled guidance on tuning the parameter in $α$-TCAV -- either to imitate Multi-TCAV at substantially lower computational cost, or to obtain a calibrated Bayes-optimal probabilistic measure of a concept's influence. Finally, our analysis yields practical recommendations that challenge established routines: most notably, allocating the full sampling budget to a single CAV rather than splitting it across several.
- Abstract(参考訳): 概念活性化ベクトル(Concept Activation Vectors, CAV)は、深層学習における概念に基づく説明可能性の基本的ツールであるが、その実用性は統計的不安定性によって制限される。
我々は,CAVの確率的性質とCAVを用いたテスト(TCAV)法を解析し,PatternCAV,FastCAV,リッジ回帰に基づくCAVなどの主要なCAVクラスの分布を導出する。
そして,その不連続な指標関数への依存は,臨界状態における非破壊的分散を誘導する。
これを解決するために,パラメータ化スムーズな関数に代えて,TCAVとMulti-TCAVの両方を仮定した統一確率式を生成する,一般化されたフレームワークである$α$-TCAVを導入する。
感性スコアと様々なTCAV変動の誘導分布を特徴付け, 確立された最先端の選択には理論的正当性が欠如していることが示唆された。
我々は,パラメータを$α$-TCAVでチューニングする原理的なガイダンスを提供する。これは,計算コストが大幅に低いマルチTCAVを模倣するか,あるいは概念の影響を校正したベイズ最適確率測定値を得るためかである。
最後に、我々の分析では、確立されたルーチンに挑戦する実践的なレコメンデーションが得られています。
関連論文リスト
- E-TCAV: Formalizing Penultimate Proxies for Efficient Concept Based Interpretability [6.496864934809427]
TCAV (Testing with Concept Activation Vectors) は、解釈可能な方法である。
TCAVは計算オーバーヘッド、TCAVスコアの層間不一致、統計的不安定さに悩まされている。
E-TCAVは、TCAVスコアの効率的な近似のためのフレームワークである。
論文 参考訳(メタデータ) (2026-05-11T09:25:41Z) - TPV: Parameter Perturbations Through the Lens of Test Prediction Variance [1.9443009938188445]
テスト予測分散(TPV)は、トレーニングされた解の周囲の摂動に対するモデル出力の1次感度である。
TPVは、訓練されたモデルの幾何学を特定の摂動機構から分離する、完全なラベルのない物体である。
論文 参考訳(メタデータ) (2025-12-11T20:04:33Z) - One Sample is Enough to Make Conformal Prediction Robust [53.78604391939934]
共形予測は, 1つのランダムな摂動入力に対して前方通過しても, ある程度の堅牢性が得られることを示す。
提案手法は,入力毎に多数のパス(例えば100回程度)を使用するSOTA法と比較して,平均セットサイズが小さいロバストな集合を返す。
論文 参考訳(メタデータ) (2025-06-19T19:14:25Z) - Probabilistic Variational Contrastive Learning [8.23660331371415]
我々は,エビデンスローバウンド(ELBO)を最大化するデコーダフリーフレームワークを提案する。
約$q_theta(z|x)$を投影正規分布としてモデル化し、確率的埋め込みのサンプリングを可能にする。
論文 参考訳(メタデータ) (2025-06-11T20:26:07Z) - Navigating Neural Space: Revisiting Concept Activation Vectors to Overcome Directional Divergence [13.618809162030486]
概念活性化ベクトル (Concept Activation Vectors, CAV) は、潜在空間における人間の理解可能な概念をモデル化するための一般的なツールである。
本稿では、そのような分離性指向の解が、概念の方向性を正確にモデル化する実際の目標から逸脱する可能性があることを示す。
パターンベースのCAVを導入し、概念信号のみに着目し、より正確な概念指示を提供する。
論文 参考訳(メタデータ) (2022-02-07T19:40:20Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - CC-Cert: A Probabilistic Approach to Certify General Robustness of
Neural Networks [58.29502185344086]
安全クリティカルな機械学習アプリケーションでは、モデルを敵の攻撃から守ることが不可欠である。
意味的に意味のある入力変換に対して、ディープラーニングモデルの証明可能な保証を提供することが重要である。
我々はChernoff-Cramer境界に基づく新しい普遍確率的証明手法を提案する。
論文 参考訳(メタデータ) (2021-09-22T12:46:04Z) - Trust but Verify: Assigning Prediction Credibility by Counterfactual
Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。
これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。
この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文 参考訳(メタデータ) (2020-11-24T19:52:38Z) - Evaluating probabilistic classifiers: Reliability diagrams and score
decompositions revisited [68.8204255655161]
確率的に統計的に一貫性があり、最適に結合し、再現可能な信頼性図を自動生成するCORP手法を導入する。
コーパスは非パラメトリックアイソトニック回帰に基づいており、プール・アジャセント・ヴァイオレータ(PAV)アルゴリズムによって実装されている。
論文 参考訳(メタデータ) (2020-08-07T08:22:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。