論文の概要: LLpowershap: Logistic Loss-based Automated Shapley Values Feature
Selection Method
- arxiv url: http://arxiv.org/abs/2401.12683v1
- Date: Tue, 23 Jan 2024 11:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 15:55:34.363696
- Title: LLpowershap: Logistic Loss-based Automated Shapley Values Feature
Selection Method
- Title(参考訳): LLpowershap:ロジスティック損失に基づくシェープ値の自動特徴選択法
- Authors: Iqbal Madakkatel and Elina Hypp\"onen
- Abstract要約: 損失に基づくShapley値を用いて最小ノイズで情報的特徴を識別する新しい特徴選択手法LLpowershapを提案する。
シミュレーションの結果,LLpowershapはより多くの情報特徴を識別するだけでなく,他の最先端特徴選択法と比較して,ノイズ特性の少ない特徴を出力することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shapley values have been used extensively in machine learning, not only to
explain black box machine learning models, but among other tasks, also to
conduct model debugging, sensitivity and fairness analyses and to select
important features for robust modelling and for further follow-up analyses.
Shapley values satisfy certain axioms that promote fairness in distributing
contributions of features toward prediction or reducing error, after accounting
for non-linear relationships and interactions when complex machine learning
models are employed. Recently, a number of feature selection methods utilising
Shapley values have been introduced. Here, we present a novel feature selection
method, LLpowershap, which makes use of loss-based Shapley values to identify
informative features with minimal noise among the selected sets of features.
Our simulation results show that LLpowershap not only identifies higher number
of informative features but outputs fewer noise features compared to other
state-of-the-art feature selection methods. Benchmarking results on four
real-world datasets demonstrate higher or at par predictive performance of
LLpowershap compared to other Shapley based wrapper methods, or filter methods.
- Abstract(参考訳): shapleyの値は、ブラックボックスの機械学習モデルを説明するだけでなく、モデルデバッグ、感度、公平性分析の実行、堅牢なモデリングとさらなる追従分析のための重要な特徴の選択のためにも、機械学習で広く使われている。
shapleyの値は、複雑な機械学習モデルを採用する場合の非線形関係と相互作用を考慮すれば、予測やエラーの低減に対する特徴の分配における公平性を促進する、ある種の公理を満たす。
近年,Shapley値を利用した機能選択手法が数多く導入されている。
本稿では,選択された特徴セットのうち,最小ノイズの有意な特徴を識別するために,損失に基づくシェープリー値を用いた新しい特徴選択法であるllpowershapを提案する。
シミュレーションの結果,LLpowershapはより多くの情報特徴を識別するだけでなく,他の最先端特徴選択法と比較して,ノイズ特徴を出力する。
4つの実世界のデータセットのベンチマークの結果は、他のShapleyベースのラッパーメソッドやフィルタメソッドと比較して、LLpowershapのより高いまたは同等な予測性能を示している。
関連論文リスト
- Shap-Select: Lightweight Feature Selection Using SHAP Values and Regression [0.0]
本稿では,新しい特徴選択フレームワーク,shap-selectを提案する。
フレームワークは、特徴のShapley値、検証セットに基づいてターゲットの線形的あるいはロジスティックな回帰を行い、回帰係数の符号と重要度を用いて特徴選択の効率的な実装を行う。
筆者らは、Kaggleクレジットカード詐欺データセットのシェープ選択を評価し、確立された方法と比較して、その有効性を実証した。
論文 参考訳(メタデータ) (2024-10-09T12:14:06Z) - LLM-Select: Feature Selection with Large Language Models [64.5099482021597]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文 参考訳(メタデータ) (2024-07-02T22:23:40Z) - IGANN Sparse: Bridging Sparsity and Interpretability with Non-linear Insight [4.010646933005848]
IGANN Sparseは、一般化された加法モデルのファミリーから生まれた、新しい機械学習モデルである。
トレーニング中の非線形特徴選択プロセスを通じて、スパシティを促進する。
これにより、予測性能を犠牲にすることなく、モデル空間の改善による解釈可能性を保証する。
論文 参考訳(メタデータ) (2024-03-17T22:44:36Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Explaining Predictive Uncertainty with Information Theoretic Shapley
Values [6.49838460559032]
我々は、様々な種類の予測の不確実性を説明するために、人気のShapley値フレームワークを適用します。
我々は,実データおよびシミュレーションデータに対して,様々な実験でよく動作する効率的なアルゴリズムを実装した。
論文 参考訳(メタデータ) (2023-06-09T07:43:46Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Near-optimal Offline Reinforcement Learning with Linear Representation:
Leveraging Variance Information with Pessimism [65.46524775457928]
オフライン強化学習は、オフライン/歴史的データを活用して、シーケンシャルな意思決定戦略を最適化しようとしている。
線形モデル表現を用いたオフライン強化学習の統計的限界について検討する。
論文 参考訳(メタデータ) (2022-03-11T09:00:12Z) - Exact Shapley Values for Local and Model-True Explanations of Decision
Tree Ensembles [0.0]
決定木アンサンブルの説明にShapley値を適用することを検討する。
本稿では,無作為林に適応し,決定木を増強できる,Shapley値に基づく特徴属性に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-12-16T20:16:02Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - A Multilinear Sampling Algorithm to Estimate Shapley Values [4.771833920251869]
ゲーム理論に適用したマルチ線形拡張手法に基づく新しいサンプリング手法を提案する。
本手法は任意の機械学習モデル,特に多クラス分類や回帰問題に適用可能である。
論文 参考訳(メタデータ) (2020-10-22T21:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。