論文の概要: The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity
- arxiv url: http://arxiv.org/abs/2605.21492v1
- Date: Wed, 08 Apr 2026 10:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.98025
- Title: The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity
- Title(参考訳): 特徴ランク付けは誠実で、安定し、コリニエティの下で完ぺきに
- Authors: Drake Caraker, Bryan Arnold, David Rhoads,
- Abstract要約: 機能がコリニアである場合には,機能ランキングを忠実に,安定的に,かつ完全なものにすることはできない。
この不合理性を証明し、4つのモデルクラスを定量化し、アンサンブル平均化(DASH)によってそれを解決し、305のLean 4定理でそれをマシン検証する。
設計空間の定理、診断、そして不合理性はLean 4(16の公理から305の定理、残念なことに0の定理)で機械的に検証されます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: No feature ranking can be simultaneously faithful, stable, and complete when features are collinear. For collinear pairs, ranking reduces to a coin flip. We prove this impossibility, quantify it for four model classes, resolve it via ensemble averaging (DASH), and machine-verify it with 305 Lean 4 theorems. We characterize the complete attribution design space: exactly two families of methods exist -- faithful-complete methods (unstable, with rankings that flip up to 50% of the time) and ensemble methods like DASH (stable, reporting ties for symmetric features) -- and no method lies outside this dichotomy. The impossibility is quantitative: the attribution ratio diverges as 1/(1-rho^2) for gradient boosting, is infinite for Lasso, and converges for random forests. DASH (Diversified Aggregation of SHAP) is provably Pareto-optimal among unbiased aggregations, achieving the Cramer-Rao variance bound with a tight ensemble size formula. In a survey of 77 public datasets, 68% exhibit attribution instability. Switching to conditional SHAP does not escape the impossibility when features have equal causal effects. The framework includes practical diagnostics -- a Z-test workflow and single-model screening tool -- and has direct consequences for fairness auditing: SHAP-based proxy discrimination audits are provably unreliable under collinearity. The design space theorem, diagnostics, and impossibility are mechanically verified in Lean 4 (305 theorems from 16 axioms, 0 sorry) -- to our knowledge, the first formally verified impossibility in explainable AI.
- Abstract(参考訳): 機能がコリニアである場合には,機能ランキングを忠実に,安定的に,かつ完全なものにすることはできない。
コリニアペアの場合、ランクはコインフリップに還元される。
この不合理性を証明し、4つのモデルクラスを定量化し、アンサンブル平均化(DASH)によってそれを解決し、305のLean 4定理でそれをマシン検証する。
私たちは、完全な帰属設計空間を特徴付けています。メソッドの2つのファミリ – 忠実で完備なメソッド(最大50%の時間を反転させるランク付きで、不安定)とDASH(stable, report ties for symmetric features)のようなアンサンブルメソッド -- が存在し、この二分法の外にあるメソッドはありません。
帰属比は1/(1-rho^2) に偏り、ラッソでは無限であり、ランダムな森林では収束する。
DASH (Diversified Aversified Aggregation of SHAP) は不偏集合のパレート最適であり, 密接なアンサンブルサイズの式でクラマー・ラオ分散を達成する。
77の公開データセットを対象とした調査では、68%が属性不安定を示している。
条件付きSHAPへの切り替えは、特徴が因果効果に等しい場合、不可能を逃れることはできない。
フレームワークには、Zテストワークフローとシングルモデルスクリーニングツールの実践的診断が含まれており、公正性監査の直接的な影響がある。
設計空間の定理、診断、そして不合理性はLean 4(16の公理から305の定理、残念なことに0の定理)で機械的に検証されます。
関連論文リスト
- When Are Trade-Off Functions Testable from Finite Samples? [4.706977254727891]
2つの未知確率分布のトレードオフ関数に対する有限サンプル推論について検討する。
テストの反転により、トレードオフ曲線全体に対する同時信頼バンドも得られる。
論文 参考訳(メタデータ) (2026-05-11T16:07:48Z) - The Pokémon Theorem and other Fairness Impossibility Results [6.291388054687868]
条件付き平均埋め込みに対する線形制約が公平性基準であることが示される。
また、不平等な基準レートが、これらの制約を過大評価する総予想の法則を成していることも示している。
論文 参考訳(メタデータ) (2026-05-09T23:37:10Z) - PAIR-CI: Calibrated Conditional Independence Testing for Causal Discovery with Incomplete Data [0.0]
PAIR-CIは非パラメトリック条件独立(CI)テストであり,複数の命令を直接推論手順に統合することによりキャリブレーションを回復する。
確率的に一貫した分散推定器は、クロスバリデーションと多重計算による不確かさを共同で説明する。
論文 参考訳(メタデータ) (2026-05-06T12:34:37Z) - Exact Structural Abstraction and Tractability Limits [0.0]
正確な正確性は、誘導されたクラス $s sim_R simation' iff MathrmAdm_R(s)$ にのみ依存する。
決定、探索、近似、統計的、ランダム化された地平線、分布保証は全て同じ商-回復問題に還元される。
論文 参考訳(メタデータ) (2026-04-08T17:59:47Z) - The Digital Twin Counterfactual Framework: A Validation Architecture for Simulated Potential Outcomes [0.0]
Digital Twin Counterfactual Framework (DTCF)
五段階検証アーキテクチャは、シミュレーターが正しい反事実を生成できるという不当な主張を、観測可能なデータに対する偽証可能なテストに変換する。
分解は因果量から極端に検証されるものへと分離する。
共同因果関係の主張は明示的な前提付きとなる。
論文 参考訳(メタデータ) (2026-04-01T19:04:15Z) - Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。
正規分布の間の2-ワッサーシュタイン距離の上界を導出する。
幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文 参考訳(メタデータ) (2025-02-14T22:37:11Z) - SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。
我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。
本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-21T03:39:04Z) - Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations [44.71254888821376]
我々は、一般的な非データ生成プロセスの下で、最初のタイプIエラーと予測リジェクション時間保証を提供する。
本研究では, 平均処理効果など, 方程式を推定することによって定義されるパラメータの推測に, 結果を適用する方法を示す。
論文 参考訳(メタデータ) (2022-12-29T18:37:08Z) - Distribution-free binary classification: prediction sets, confidence
intervals and calibration [106.50279469344937]
分布自由条件における二項分類のための不確実性定量化(キャリブレーション、信頼区間、予測セット)の3つの概念について検討する。
固定幅と一様質量の両双対の双対確率に対する信頼区間を導出する。
我々の「三脚」定理の結果として、双有理確率に対するこれらの信頼区間は分布自由キャリブレーションに繋がる。
論文 参考訳(メタデータ) (2020-06-18T14:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。