論文の概要: Marginal and Conditional Importance Measures from Machine Learning Models and Their Relationship with Conditional Average Treatment Effect
- arxiv url: http://arxiv.org/abs/2501.16988v1
- Date: Tue, 28 Jan 2025 14:41:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-29 16:42:47.183440
- Title: Marginal and Conditional Importance Measures from Machine Learning Models and Their Relationship with Conditional Average Treatment Effect
- Title(参考訳): 機械学習モデルからのマージナル・コンディションの重要度と条件平均処理効果との関係
- Authors: Mohammad Kaviul Anam Khan, Olli Saarela, Rafal Kustra,
- Abstract要約: MRIM(Marginal Variable Importance Metric)は,真の条件付き期待関数に基づく重要度をモデルに依存しない尺度である。
MVIMは、ブラックボックスモデルが低確率領域で外挿に苦慮しているため、予測器が非常に相関しているときにバイアスを受ける。
このバイアスを低減するためにCVIM(Con Conditional Variable Importance Metric)を導入する。
- 参考スコア(独自算出の注目度): 0.18906710320196732
- License:
- Abstract: Interpreting black-box machine learning models is challenging due to their strong dependence on data and inherently non-parametric nature. This paper reintroduces the concept of importance through "Marginal Variable Importance Metric" (MVIM), a model-agnostic measure of predictor importance based on the true conditional expectation function. MVIM evaluates predictors' influence on continuous or discrete outcomes. A permutation-based estimation approach, inspired by \citet{breiman2001random} and \citet{fisher2019all}, is proposed to estimate MVIM. MVIM estimator is biased when predictors are highly correlated, as black-box models struggle to extrapolate in low-probability regions. To address this, we investigated the bias-variance decomposition of MVIM to understand the source and pattern of the bias under high correlation. A Conditional Variable Importance Metric (CVIM), adapted from \citet{strobl2008conditional}, is introduced to reduce this bias. Both MVIM and CVIM exhibit a quadratic relationship with the conditional average treatment effect (CATE).
- Abstract(参考訳): ブラックボックス機械学習モデルの解釈は、データと本質的に非パラメトリックな性質に強く依存しているため、難しい。
本稿では,真の条件付き予測関数に基づく予測的重要性のモデルに依存しない尺度であるMVIM(Marginal Variable Importance Metric)を通じて,重要度の概念を再導入する。
MVIMは、連続的または離散的な結果に対する予測者の影響を評価する。
MVIMを推定するために, 置換に基づく推定手法が提案されている。
MVIM推定器は、ブラックボックスモデルが低確率領域における外挿に苦慮しているため、予測器が非常に相関しているときにバイアスを受ける。
そこで本研究では, MVIMの偏差分解について検討し, 高相関下での偏差の発生源とパターンについて考察した。
CVIM (Conditional Variable Importance Metric) は、このバイアスを減らすために、 \citet{strobl2008 Conditional} から適応された。
MVIMとCVIMは条件平均治療効果(CATE)と二次的な関係を示す。
関連論文リスト
- Model aggregation: minimizing empirical variance outperforms minimizing
empirical error [0.29008108937701327]
多様なモデルからの予測を単一のより正確な出力に集約する,データ駆動型フレームワークを提案する。
モデルはブラックボックス関数として扱う、モデルに依存しない、最小限の仮定を必要とする、広範囲のモデルからの出力を組み合わせることができる。
従来の解法と機械学習モデルをうまく統合して、堅牢性と精度の両方を改善する方法を示す。
論文 参考訳(メタデータ) (2024-09-25T18:33:21Z) - Exploiting Observation Bias to Improve Matrix Completion [15.171759590760574]
観測パターンと興味の結果が、下層の潜在的(あるいは観測されていない)要因の同じセットによって駆動される自然モデルを提案する。
我々は,新しい2段階行列補完アルゴリズムであるMask Nearest Neighbor (MNN)を考案した。
分析の結果,MNNは,教師付き学習パラメトリックレートと競合するエントリーワイド有限サンプル誤差率を享受していることがわかった。
論文 参考訳(メタデータ) (2023-06-07T20:48:35Z) - Biases in Inverse Ising Estimates of Near-Critical Behaviour [0.0]
逆推論は、ペアワイズ相互作用を経験的相関から再構成することを可能にする。
Pseudo-likelihood (PLM) などの推定値に偏りが認められた。
データ駆動法は神経科学による機能的磁気共鳴イメージング(fMRI)データセットに研究され応用された。
論文 参考訳(メタデータ) (2023-01-13T14:01:43Z) - A Generalized Variable Importance Metric and Estimator for Black Box
Machine Learning Models [0.21249247666376617]
我々は、ブラックボックス機械学習手法における予測器の重要性を測定するために、集団パラメータ、一般化可変重要度指標(GVIM)'を定義した。
我々は,定義したGVIMが,任意の種類の予測器に対する条件平均処理効果(CATE)の関数として表現可能であることを示すために,予め公表した結果を拡張した。
論文 参考訳(メタデータ) (2022-12-20T00:50:28Z) - Monotonicity and Double Descent in Uncertainty Estimation with Gaussian
Processes [52.92110730286403]
限界確率はクロスバリデーションの指標を思い起こさせるべきであり、どちらもより大きな入力次元で劣化すべきである、と一般的に信じられている。
我々は,ハイパーパラメータをチューニングすることにより,入力次元と単調に改善できることを証明した。
また、クロスバリデーションの指標は、二重降下の特徴である質的に異なる挙動を示すことも証明した。
論文 参考訳(メタデータ) (2022-10-14T08:09:33Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Beyond Marginal Uncertainty: How Accurately can Bayesian Regression
Models Estimate Posterior Predictive Correlations? [13.127549105535623]
入力位置の異なる関数値間の予測的相関を推定することは、しばしば有用である。
まず、後続の予測相関に依存する下流タスクについて考察する:トランスダクティブアクティブラーニング(TAL)
TALは高価で間接的にアルゴリズムの開発を誘導できないため、予測相関をより直接的に評価する2つの指標を導入する。
論文 参考訳(メタデータ) (2020-11-06T03:48:59Z) - Latent Causal Invariant Model [128.7508609492542]
現在の教師付き学習は、データ適合プロセス中に急激な相関を学習することができる。
因果予測を求める潜在因果不変モデル(LaCIM)を提案する。
論文 参考訳(メタデータ) (2020-11-04T10:00:27Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。