論文の概要: A feature selection method based on Shapley values robust to concept
shift in regression
- arxiv url: http://arxiv.org/abs/2304.14774v1
- Date: Fri, 28 Apr 2023 11:34:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 14:29:13.220309
- Title: A feature selection method based on Shapley values robust to concept
shift in regression
- Title(参考訳): 回帰における概念シフトに頑健なシェープリー値に基づく特徴選択法
- Authors: Carlos Sebasti\'an and Carlos E. Gonz\'alez-Guill\'en
- Abstract要約: データセットシフトの問題に遭遇することが一般的であり、具体的には変数間の関係の変化(概念シフト)である。
この場合、変換フェーズで学習した関係が現在の状況と一致しないため、変数の影響はモデルの回帰子としての品質を示す唯一の指標にはならない。
本稿では,この事実を考慮に入れた回帰問題に対する特徴選択手法を提案し,各変数が予測に与える影響をShapley値を用いて検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feature selection is one of the most relevant processes in any methodology
for creating a statistical learning model. Generally, existing algorithms
establish some criterion to select the most influential variables, discarding
those that do not contribute any relevant information to the model. This
methodology makes sense in a classical static situation where the joint
distribution of the data does not vary over time. However, when dealing with
real data, it is common to encounter the problem of the dataset shift and,
specifically, changes in the relationships between variables (concept shift).
In this case, the influence of a variable cannot be the only indicator of its
quality as a regressor of the model, since the relationship learned in the
traning phase may not correspond to the current situation. Thus, we propose a
new feature selection methodology for regression problems that takes this fact
into account, using Shapley values to study the effect that each variable has
on the predictions. Five examples are analysed: four correspond to typical
situations where the method matches the state of the art and one example
related to electricity price forecasting where a concept shift phenomenon has
occurred in the Iberian market. In this case the proposed algorithm improves
the results significantly.
- Abstract(参考訳): 特徴選択は、統計学習モデルを作成するあらゆる方法論において、最も関連するプロセスの1つです。
一般に、既存のアルゴリズムは最も影響力のある変数を選択するための基準を確立し、関連する情報をモデルに提供しない変数を捨てる。
この手法は、データの結合分布が時間とともに変化しない古典的な静的状況において意味がある。
しかし、実際のデータを扱う場合、データセットシフトの問題、具体的には変数間の関係の変化(概念シフト)に遭遇することが一般的である。
この場合、変換フェーズで学習した関係が現在の状況と一致しないため、変数の影響はモデルの回帰子としての品質を示す唯一の指標にはならない。
そこで本研究では,この事実を考慮に入れた回帰問題に対する特徴選択手法を提案し,各変数が予測に与える影響をShapley値を用いて検討する。
4つの例は、その方法が芸術の状況と一致する典型的な状況と、イベリア市場で概念シフト現象が起こった電力価格予測に関連する1つの例に対応する。
この場合,提案アルゴリズムは結果を大幅に改善する。
関連論文リスト
- Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [13.12743473333296]
非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文 参考訳(メタデータ) (2024-11-25T12:08:54Z) - Counterfactual Fairness through Transforming Data Orthogonal to Bias [7.109458605736819]
我々は新しいデータ前処理アルゴリズムOrthogonal to Bias (OB)を提案する。
OBは、連続的な敏感な変数群の影響を排除し、機械学習アプリケーションにおける反ファクトフェアネスを促進するように設計されている。
OBはモデルに依存しないため、幅広い機械学習モデルやタスクに適用できる。
論文 参考訳(メタデータ) (2024-03-26T16:40:08Z) - On the Limited Representational Power of Value Functions and its Links
to Statistical (In)Efficiency [6.408072565019087]
遷移力学に関する情報は、値関数の空間で表現することは不可能かもしれない。
より深い調査は、表現力の限界が非効率性のドライバであることを示している。
論文 参考訳(メタデータ) (2024-03-11T20:05:48Z) - Information-Theoretic State Variable Selection for Reinforcement
Learning [4.2050490361120465]
本稿では,情報理論的基準であるTransfer Entropy Redundancy Criterion (TERC)を紹介する。
TERCは、トレーニング中に状態変数からアクションに転送されるテクステントロピーがあるかどうかを判断する。
エージェントの最終性能に影響を与えない状態から変数を確実に排除する TERC に基づくアルゴリズムを定義する。
論文 参考訳(メタデータ) (2024-01-21T14:51:09Z) - It's All in the Mix: Wasserstein Machine Learning with Mixed Features [5.739657897440173]
混合機能問題の解法として,実用的なアルゴリズムを提案する。
提案手法は, 個々の特徴が存在する場合の既存手法を著しく上回りうることを示す。
論文 参考訳(メタデータ) (2023-12-19T15:15:52Z) - Towards stable real-world equation discovery with assessing
differentiating quality influence [52.2980614912553]
一般的に用いられる有限差分法に代わる方法を提案する。
我々は,これらの手法を実問題と類似した問題に適用可能であること,および方程式発見アルゴリズムの収束性を確保する能力の観点から評価する。
論文 参考訳(メタデータ) (2023-11-09T23:32:06Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - A One-step Approach to Covariate Shift Adaptation [82.01909503235385]
多くの機械学習シナリオにおけるデフォルトの前提は、トレーニングとテストサンプルは同じ確率分布から引き出されることである。
予測モデルと関連する重みを1つの最適化で共同で学習する新しいワンステップアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-08T11:35:47Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。