論文の概要: Model-agnostic Feature Importance and Effects with Dependent Features --
A Conditional Subgroup Approach
- arxiv url: http://arxiv.org/abs/2006.04628v2
- Date: Mon, 21 Jun 2021 07:59:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 00:41:11.892729
- Title: Model-agnostic Feature Importance and Effects with Dependent Features --
A Conditional Subgroup Approach
- Title(参考訳): モデル非依存な特徴の重要性と影響 : 条件付き部分群アプローチ
- Authors: Christoph Molnar, Gunnar K\"onig, Bernd Bischl, and Giuseppe
Casalicchio
- Abstract要約: 条件部分群における置換に基づく条件分布の新しいサンプリング機構を提案する。
これらの部分群は決定木(変換木)を用いて構築されるので、条件付けは本質的に解釈可能である。
本研究では,条件付きサブグループに基づくPFIとPDPが,ノックオフに基づく条件付きPFIなどの手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.7349727826230864
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The interpretation of feature importance in machine learning models is
challenging when features are dependent. Permutation feature importance (PFI)
ignores such dependencies, which can cause misleading interpretations due to
extrapolation. A possible remedy is more advanced conditional PFI approaches
that enable the assessment of feature importance conditional on all other
features. Due to this shift in perspective and in order to enable correct
interpretations, it is therefore important that the conditioning is transparent
and humanly comprehensible. In this paper, we propose a new sampling mechanism
for the conditional distribution based on permutations in conditional
subgroups. As these subgroups are constructed using decision trees
(transformation trees), the conditioning becomes inherently interpretable. This
not only provides a simple and effective estimator of conditional PFI, but also
local PFI estimates within the subgroups. In addition, we apply the conditional
subgroups approach to partial dependence plots (PDP), a popular method for
describing feature effects that can also suffer from extrapolation when
features are dependent and interactions are present in the model. We show that
PFI and PDP based on conditional subgroups often outperform methods such as
conditional PFI based on knockoffs, or accumulated local effect plots.
Furthermore, our approach allows for a more fine-grained interpretation of
feature effects and importance within the conditional subgroups.
- Abstract(参考訳): 機械学習モデルにおける特徴の重要性の解釈は、機能に依存する場合に難しい。
置換特徴重要度(PFI)はそのような依存関係を無視し、外挿による誤解を招く可能性がある。
考えられる治療は、他の全ての特徴に対する特徴重要条件の評価を可能にする、より高度な条件付きPFIアプローチである。
この視点の変化と正しい解釈を可能にするために、条件付けが透明かつ人間的に理解可能であることが重要である。
本稿では,条件付き部分群における置換に基づく条件付き分布の新しいサンプリング機構を提案する。
これらのサブグループは決定木(変換木)を用いて構築されるので、条件付けは本質的に解釈可能である。
これは条件付きPFIの単純かつ効果的な推定手段を提供するだけでなく、部分群内の局所的なPFI推定も提供する。
さらに,条件付き部分群アプローチを部分依存プロット (pdp) に適用し, 特徴が依存し, 相互作用がモデル内に存在する場合に外挿に苦しむような特徴効果を記述する一般的な手法である。
本研究では,条件付きサブグループに基づくPFIとPDPが,ノックオフに基づく条件付きPFIや局所効果プロットの蓄積といった手法よりも優れていることを示す。
さらに,本手法により,条件付き部分群における特徴効果と重要性のよりきめ細かい解釈が可能となる。
関連論文リスト
- Hierarchical Bias-Driven Stratification for Interpretable Causal Effect
Estimation [1.6874375111244329]
BICauseTreeは、自然実験が局所的に発生するクラスタを識別する解釈可能なバランシング手法である。
合成および現実的なデータセットを用いて手法の性能を評価し、バイアス-解釈可能性トレードオフを探索し、既存の手法に匹敵することを示す。
論文 参考訳(メタデータ) (2024-01-31T10:58:13Z) - Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Commutative Lie Group VAE for Disentanglement Learning [96.32813624341833]
本研究では,データに表される因子の変動を同変的に反映する基盤構造を見いだすこととして,非絡み合い学習を考察する。
グループベースの非絡み合い学習を実現するために、Communative Lie Group VAEというシンプルなモデルが導入された。
実験により,本モデルでは,教師なしの非絡み合い表現を効果的に学習し,余分な制約を伴わずに最先端のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-06-07T07:03:14Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Transforming Feature Space to Interpret Machine Learning Models [91.62936410696409]
この貢献は、特徴空間変換のレンズを通して機械学習モデルを解釈する新しいアプローチを提案する。
非条件的および条件付きポストホック診断ツールの拡張に使用できる。
提案手法の可能性を実証するために,46特徴のリモートセンシング土地被覆分類の事例研究を行った。
論文 参考訳(メタデータ) (2021-04-09T10:48:11Z) - GroupifyVAE: from Group-based Definition to VAE-based Unsupervised
Representation Disentanglement [91.9003001845855]
他の誘導バイアスを導入しないと、VAEベースの非監視的非絡み合いは実現できない。
グループ理論に基づく定義から導かれる制約を非確率的帰納的バイアスとして活用し,vaeに基づく教師なし不連続に対処する。
提案手法の有効性を検証するために,5つのデータセット上で,vaeベースモデルが最も目立つ1800モデルをトレーニングした。
論文 参考訳(メタデータ) (2021-02-20T09:49:51Z) - Relative Feature Importance [1.4474137122906163]
相対的特徴重要度(RFI)は、置換特徴重要度(PFI)と条件的特徴重要度(CFI)の一般化である。
RFIは、PFI対CFI二分法を超えて、より微妙な特徴重要度計算を可能にする。
相対的特徴関連性の意味の詳細な理論的解析に基づいて、RFIの一般的な解釈規則を導出する。
論文 参考訳(メタデータ) (2020-07-16T12:20:22Z) - Controlling for sparsity in sparse factor analysis models: adaptive
latent feature sharing for piecewise linear dimensionality reduction [2.896192909215469]
本稿では,現在潜伏している特徴分解技術の鍵となる限界に対処できる,シンプルでトラクタブルな特徴割り当てモデルを提案する。
適応型因子分析(aFA)と適応型確率的原理成分分析(aPPCA)を応用し,柔軟な構造発見と次元減少を実現する。
APPCAとaFAは、生のMNISTに適用した場合と、オートエンコーダの特徴を解釈する場合の両方において、高いレベルの特徴を推測できることを示す。
論文 参考訳(メタデータ) (2020-06-22T16:09:11Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。