論文の概要: A feature selection method based on Shapley values robust to concept
shift in regression
- arxiv url: http://arxiv.org/abs/2304.14774v3
- Date: Mon, 25 Sep 2023 06:05:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 03:02:31.081320
- Title: A feature selection method based on Shapley values robust to concept
shift in regression
- Title(参考訳): 回帰における概念シフトに頑健なシェープリー値に基づく特徴選択法
- Authors: Carlos Sebasti\'an and Carlos E. Gonz\'alez-Guill\'en
- Abstract要約: 本稿では,Shapley値と予測誤差の直接的な関係について述べる。
提案アルゴリズムは, 概念シフトのシナリオにおいて, 最先端の特徴選択手法よりも優れていることを示す。
また,シフトのない場合のアルゴリズムの頑健さを評価するために,標準状況の3つの解析を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feature selection is one of the most relevant processes in any methodology
for creating a statistical learning model. Usually, existing algorithms
establish some criterion to select the most influential variables, discarding
those that do not contribute to the model with any relevant information. This
methodology makes sense in a static situation where the joint distribution of
the data does not vary over time. However, when dealing with real data, it is
common to encounter the problem of the dataset shift and, specifically, changes
in the relationships between variables (concept shift). In this case, the
influence of a variable cannot be the only indicator of its quality as a
regressor of the model, since the relationship learned in the training phase
may not correspond to the current situation. In tackling this problem, our
approach establishes a direct relationship between the Shapley values and
prediction errors, operating at a more local level to effectively detect the
individual biases introduced by each variable. The proposed methodology is
evaluated through various examples, including synthetic scenarios mimicking
sudden and incremental shift situations, as well as two real-world cases
characterized by concept shifts. Additionally, we perform three analyses of
standard situations to assess the algorithm's robustness in the absence of
shifts. The results demonstrate that our proposed algorithm significantly
outperforms state-of-the-art feature selection methods in concept shift
scenarios, while matching the performance of existing methodologies in static
situations.
- Abstract(参考訳): 特徴選択は、統計学習モデルを作成するあらゆる方法論において、最も関連するプロセスの1つです。
通常、既存のアルゴリズムは最も影響力のある変数を選択するための基準を確立し、関連する情報を持ってモデルに寄与しない変数を破棄する。
この手法は、データの結合分布が時間とともに変化しない静的な状況において意味がある。
しかし、実際のデータを扱う場合、データセットシフトの問題、具体的には変数間の関係の変化(概念シフト)に遭遇することが一般的である。
この場合、トレーニングフェーズで学んだ関係が現在の状況と一致しない可能性があるため、モデルのレグレッサーとしての品質を示すのは変数の影響だけではない。
この問題に対処するため,本手法では,各変数の個々のバイアスを効果的に検出するために,より局所的なレベルで動作することにより,Shapley値と予測誤差の直接的な関係を確立する。
提案手法は, 突発的, 漸増的なシフトを模倣する合成シナリオや, 概念シフトを特徴とする2つの実世界のケースなど, 様々な例で評価されている。
さらに,標準状態の3つの解析を行い,シフトのない場合のアルゴリズムのロバスト性を評価する。
その結果,提案アルゴリズムは,静的な状況下での既存手法の性能と整合しながら,概念シフトシナリオにおける最先端機能選択手法を著しく上回ることを示した。
関連論文リスト
- Counterfactual Fairness through Transforming Data Orthogonal to Bias [7.109458605736819]
我々は新しいデータ前処理アルゴリズムOrthogonal to Bias (OB)を提案する。
OBは、連続的な敏感な変数群の影響を排除し、機械学習アプリケーションにおける反ファクトフェアネスを促進するように設計されている。
OBはモデルに依存しないため、幅広い機械学習モデルやタスクに適用できる。
論文 参考訳(メタデータ) (2024-03-26T16:40:08Z) - On the Limited Representational Power of Value Functions and its Links
to Statistical (In)Efficiency [6.408072565019087]
遷移力学に関する情報は、値関数の空間で表現することは不可能かもしれない。
より深い調査は、表現力の限界が非効率性のドライバであることを示している。
論文 参考訳(メタデータ) (2024-03-11T20:05:48Z) - Information-Theoretic State Variable Selection for Reinforcement
Learning [4.2050490361120465]
本稿では,情報理論的基準であるTransfer Entropy Redundancy Criterion (TERC)を紹介する。
TERCは、トレーニング中に状態変数からアクションに転送されるテクステントロピーがあるかどうかを判断する。
エージェントの最終性能に影響を与えない状態から変数を確実に排除する TERC に基づくアルゴリズムを定義する。
論文 参考訳(メタデータ) (2024-01-21T14:51:09Z) - It's All in the Mix: Wasserstein Machine Learning with Mixed Features [5.739657897440173]
混合機能問題の解法として,実用的なアルゴリズムを提案する。
提案手法は, 個々の特徴が存在する場合の既存手法を著しく上回りうることを示す。
論文 参考訳(メタデータ) (2023-12-19T15:15:52Z) - Towards stable real-world equation discovery with assessing
differentiating quality influence [52.2980614912553]
一般的に用いられる有限差分法に代わる方法を提案する。
我々は,これらの手法を実問題と類似した問題に適用可能であること,および方程式発見アルゴリズムの収束性を確保する能力の観点から評価する。
論文 参考訳(メタデータ) (2023-11-09T23:32:06Z) - Effective Restoration of Source Knowledge in Continual Test Time
Adaptation [44.17577480511772]
本稿では、動的環境におけるドメインシフトを識別できる教師なし領域変更検出手法を提案する。
情報源から知識を復元することにより、モデルパラメータの段階的劣化に起因する負の結果を効果的に補正する。
我々は,最先端の適応手法と比較して,提案手法の優れた性能を示すために,ベンチマークデータセットの広範な実験を行った。
論文 参考訳(メタデータ) (2023-11-08T19:21:48Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - A One-step Approach to Covariate Shift Adaptation [82.01909503235385]
多くの機械学習シナリオにおけるデフォルトの前提は、トレーニングとテストサンプルは同じ確率分布から引き出されることである。
予測モデルと関連する重みを1つの最適化で共同で学習する新しいワンステップアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-08T11:35:47Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。