論文の概要: Factor Importance Ranking and Selection using Total Indices
- arxiv url: http://arxiv.org/abs/2401.00800v1
- Date: Mon, 1 Jan 2024 16:02:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 15:44:59.490974
- Title: Factor Importance Ranking and Selection using Total Indices
- Title(参考訳): 総合指標を用いた因子重要度ランキングと選択
- Authors: Chaofan Huang, V. Roshan Joseph
- Abstract要約: 要因の重要度は、特定の予測アルゴリズムに頼ることなく、機能の予測可能性を特徴づけるべきである。
本研究は,地球規模の感度分析から,予測可能性とソボ指標との等価性を示す。
ノイズデータから直接推定できる新しい一貫した推定器を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Factor importance measures the impact of each feature on output prediction
accuracy. Many existing works focus on the model-based importance, but an
important feature in one learning algorithm may hold little significance in
another model. Hence, a factor importance measure ought to characterize the
feature's predictive potential without relying on a specific prediction
algorithm. Such algorithm-agnostic importance is termed as intrinsic importance
in Williamson et al. (2023), but their estimator again requires model fitting.
To bypass the modeling step, we present the equivalence between predictiveness
potential and total Sobol' indices from global sensitivity analysis, and
introduce a novel consistent estimator that can be directly estimated from
noisy data. Integrating with forward selection and backward elimination gives
rise to FIRST, Factor Importance Ranking and Selection using Total (Sobol')
indices. Extensive simulations are provided to demonstrate the effectiveness of
FIRST on regression and binary classification problems, and a clear advantage
over the state-of-the-art methods.
- Abstract(参考訳): 因子の重要性は、各特徴が出力予測精度に与える影響を測定する。
既存の多くの研究はモデルに基づく重要性に重点を置いているが、一つの学習アルゴリズムの重要な特徴は他のモデルではほとんど意味を持たないかもしれない。
したがって、特定の予測アルゴリズムに頼ることなく、特徴の予測ポテンシャルを特徴付けることが重要となる。
このようなアルゴリズムに依存しない重要性は、Williamson et al. (2023) において本質的な重要性と呼ばれるが、その推定には再びモデルフィッティングが必要である。
モデリングステップを回避し,大域的感度解析から予測可能性と総ソボル指数の等価性を示すとともに,ノイズデータから直接推定できる新しい一貫した推定器を導入する。
前方選択と後方削除を統合することで、FIRST、Facter Importance Ranking、およびTotal (Sobol')指標による選択が生まれる。
回帰および二項分類問題に対するFIRSTの有効性と、最先端手法に対する明らかな優位性を示すため、広範囲なシミュレーションが提供される。
関連論文リスト
- A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [48.96686419141881]
大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。
モデルの出力分布に関する高い確率保証を持つ新しい指標を導出する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文 参考訳(メタデータ) (2024-10-04T15:44:23Z) - Deep Probability Segmentation: Are segmentation models probability estimators? [0.7646713951724011]
モデルのキャリブレーションへの影響を評価するために,セグメンテーションタスクにキャリブレーション確率推定を適用した。
その結果, キャリブレーションはキャリブレーションが向上するが, 分類タスクに比べ, キャリブレーションの効果は低かった。
また, キャリブレーションの有効性に及ぼすデータセットサイズとビン最適化の影響についても検討した。
論文 参考訳(メタデータ) (2024-09-19T07:52:19Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Generalizing Backpropagation for Gradient-Based Interpretability [103.2998254573497]
モデルの勾配は、半環を用いたより一般的な定式化の特別な場合であることを示す。
この観測により、バックプロパゲーションアルゴリズムを一般化し、他の解釈可能な統計を効率的に計算することができる。
論文 参考訳(メタデータ) (2023-07-06T15:19:53Z) - Inferring feature importance with uncertainties in high-dimensional data [0.0]
推定器における不確実性を含む個々の特徴の重要性を推定するためのShapley値に基づくフレームワークを提案する。
我々は最近発表されたSAGEの機能重要度尺度に基づいて構築し、木モデルの再サンプリングなしに推定できるサブSAGEを導入する。
論文 参考訳(メタデータ) (2021-09-02T11:57:34Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Reachable Sets of Classifiers and Regression Models: (Non-)Robustness
Analysis and Robust Training [1.0878040851638]
分類器と回帰モデルの両方の頑健性特性を解析・拡張する。
具体的には、(非)難易度を検証し、堅牢なトレーニング手順を提案し、我々のアプローチが敵攻撃よりも優れていることを示す。
第2に、ラベル付けされていない入力に対する信頼できない予測と信頼できない予測を区別し、各特徴が予測に与える影響を定量化し、特徴ランキングを計算する技術を提供する。
論文 参考訳(メタデータ) (2020-07-28T10:58:06Z) - Nonparametric Feature Impact and Importance [0.6123324869194193]
データ上で直接動作する部分依存曲線から導かれる特徴的影響と重要性の数学的定義を与える。
品質を評価するために、これらの定義によってランク付けされた特徴は、既存の特徴選択技術と競合することを示す。
論文 参考訳(メタデータ) (2020-06-08T17:07:35Z) - A general framework for inference on algorithm-agnostic variable
importance [3.441021278275805]
本稿では,解釈可能なアルゴリズムに依存しない変数重要度に関する非推論のためのフレームワークを提案する。
本提案は,HIV-1感染に対する抗体調査から得られたデータを用いて,良好な手術特性を示す。
論文 参考訳(メタデータ) (2020-04-07T20:09:21Z) - Value-driven Hindsight Modelling [68.658900923595]
値推定は強化学習(RL)パラダイムの重要な構成要素である。
モデル学習は、観測系列に存在する豊富な遷移構造を利用することができるが、このアプローチは通常、報酬関数に敏感ではない。
この2つの極点の間に位置するRLにおける表現学習のアプローチを開発する。
これにより、タスクに直接関連し、値関数の学習を加速できる、抽出可能な予測ターゲットが提供される。
論文 参考訳(メタデータ) (2020-02-19T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。