論文の概要: PPFS: Predictive Permutation Feature Selection
- arxiv url: http://arxiv.org/abs/2110.10713v1
- Date: Wed, 20 Oct 2021 18:18:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-23 15:36:59.927006
- Title: PPFS: Predictive Permutation Feature Selection
- Title(参考訳): ppfs: 予測置換特徴の選択
- Authors: Atif Hassan, Jiaul H. Paik, Swanand Khare and Syed Asif Hassan
- Abstract要約: マルコフ・ブランケット(MB)の概念に基づく新しいラッパーに基づく特徴選択手法を提案する。
従来のMB法とは異なり、PPFSは分類タスクと回帰タスクの両方に使えるため、普遍的な特徴選択技術である。
本稿では,PPI(Predictive Permutation Independence)という新しい条件付き独立性テストを提案し,PPFSをラッパー特徴選択法として分類する。
- 参考スコア(独自算出の注目度): 2.502407331311937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose Predictive Permutation Feature Selection (PPFS), a novel
wrapper-based feature selection method based on the concept of Markov Blanket
(MB). Unlike previous MB methods, PPFS is a universal feature selection
technique as it can work for both classification as well as regression tasks on
datasets containing categorical and/or continuous features. We propose
Predictive Permutation Independence (PPI), a new Conditional Independence (CI)
test, which enables PPFS to be categorised as a wrapper feature selection
method. This is in contrast to current filter based MB feature selection
techniques that are unable to harness the advancements in supervised algorithms
such as Gradient Boosting Machines (GBM). The PPI test is based on the knockoff
framework and utilizes supervised algorithms to measure the association between
an individual or a set of features and the target variable. We also propose a
novel MB aggregation step that addresses the issue of sample inefficiency.
Empirical evaluations and comparisons on a large number of datasets demonstrate
that PPFS outperforms state-of-the-art Markov blanket discovery algorithms as
well as, well-known wrapper methods. We also provide a sketch of the proof of
correctness of our method. Implementation of this work is available at
\url{https://github.com/atif-hassan/PyImpetus}
- Abstract(参考訳): 本稿では,Markov Blanket (MB) の概念に基づく新しいラッパーに基づく特徴選択手法であるPPFS(Predictive Permutation Feature Selection)を提案する。
従来のMBメソッドとは異なり、PPFSは普遍的な特徴選択技術であり、分類および/または連続的な特徴を含むデータセットの回帰タスクの両方で機能する。
本稿では,PPI(Predictive Permutation Independence)という新しい条件付き独立性テストを提案し,PPFSをラッパー特徴選択法として分類する。
これは、Gradient Boosting Machines (GBM)のような教師付きアルゴリズムの進歩を利用することができない現在のフィルタベースのMB特徴選択技術とは対照的である。
PPIテストは、ノックオフフレームワークに基づいており、教師付きアルゴリズムを使用して、個人または一連の特徴と対象変数の関係を測定する。
また,サンプル非効率性の問題に対処する新しいMBアグリゲーションステップを提案する。
多数のデータセットに対する実証的な評価と比較は、PPFSが最先端のマルコフ毛布発見アルゴリズムおよびよく知られたラッパー手法よりも優れていることを示している。
また,本手法の正当性証明のスケッチも提供する。
この実装は \url{https://github.com/atif-hassan/pyimpetus} で利用可能である。
関連論文リスト
- Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Class Probability Matching Using Kernel Methods for Label Shift
Adaptation [10.926835355554553]
ラベルシフト適応のためのtextitclass probability matching (textitCPM) という新しいフレームワークを提案する。
カーネルロジスティック回帰をCPMフレームワークに組み込んで条件付き確率を推定することにより,ラベルシフト適応のためのtextitCPMKM というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-12T13:59:37Z) - Graph-Based Automatic Feature Selection for Multi-Class Classification
via Mean Simplified Silhouette [4.786337974720721]
本稿では,自動特徴選択のためのグラフベースの新しいフィルタ手法を提案する(略してGB-AFS)。
予測性能を維持するために必要な特徴の最小の組み合わせを決定する。
選択する機能の数など、ユーザ定義パラメータを一切必要としない。
論文 参考訳(メタデータ) (2023-09-05T14:37:31Z) - AdaNPC: Exploring Non-Parametric Classifier for Test-Time Adaptation [64.9230895853942]
ドメインの一般化は、ターゲットのドメイン情報を活用することなく、任意に困難にすることができる。
この問題に対処するためにテスト時適応(TTA)手法が提案されている。
本研究では,テスト時間適応(AdaNPC)を行うためにNon-Parametricを採用する。
論文 参考訳(メタデータ) (2023-04-25T04:23:13Z) - ManiFeSt: Manifold-based Feature Selection for Small Data Sets [9.649457851261909]
少数サンプル教師付き特徴選択(FS)のための新しい手法を提案する。
提案手法はまず,多機能アソシエーションをキャプチャするカーネルを用いて,各クラスの特徴空間の多様体を学習する。
テストデータに適用した場合,FSにより分類が向上し,一般化が向上することを示す。
論文 参考訳(メタデータ) (2022-07-18T12:58:01Z) - Probabilistic Permutation Graph Search: Black-Box Optimization for
Fairness in Ranking [53.94413894017409]
本稿では、置換グラフの概念に基づいて、置換分布を表現する新しい方法を提案する。
PLと同様に、PPGと呼ばれる分布表現は、公正性のブラックボックス最適化に利用できる。
論文 参考訳(メタデータ) (2022-04-28T20:38:34Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Markov Decision Process modeled with Bandits for Sequential Decision
Making in Linear-flow [73.1896399783641]
会員/加入者の獲得と保持では、複数のページを連続してマーケティングコンテンツを推奨する必要がある。
遷移確率行列をモデル化するためにBandits を用いた MDP としてこの問題を定式化することを提案する。
提案したMDPのBanditsアルゴリズムは,$epsilon$-greedyと$epsilon$-greedy,$epsilon$,IndependentBandits,InteractionBanditsでQ-learningを上回っている。
論文 参考訳(メタデータ) (2021-07-01T03:54:36Z) - Feature Selection Methods for Cost-Constrained Classification in Random
Forests [3.4806267677524896]
コストに敏感な特徴選択は、機能選択の問題であり、モデルに含めるための個々のコストを上昇させる。
ランダムフォレスト(Random Forests)は、機能選択において特に困難な問題を定義している。
小木構造から特徴を選択する新しい高速多変量特徴選択法であるShallow Tree Selectionを提案する。
論文 参考訳(メタデータ) (2020-08-14T11:39:52Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Infinite Feature Selection: A Graph-based Feature Filtering Approach [78.63188057505012]
グラフ内の経路として特徴のサブセットを考慮したフィルタリング機能選択フレームワークを提案する。
無限に進むことで、選択プロセスの計算複雑性を制限できる。
Inf-FSはほとんどどんな状況でも、つまり、保持するフィーチャの数が優先順位に固定されているときに、より良く振る舞うことを示す。
論文 参考訳(メタデータ) (2020-06-15T07:20:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。