論文の概要: ControlBurn: Feature Selection by Sparse Forests
- arxiv url: http://arxiv.org/abs/2107.00219v1
- Date: Thu, 1 Jul 2021 05:14:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-03 01:13:10.585209
- Title: ControlBurn: Feature Selection by Sparse Forests
- Title(参考訳): ControlBurn: 疎林による特徴選択
- Authors: Brian Liu and Miaolan Xie and Madeleine Udell
- Abstract要約: そこで本研究では、RASOをベースとした特徴選択法を用いて、木アンサンブルから不要な特徴を抽出する特徴選択アルゴリズムであるControlBurnを提案する。
相関した特徴を持つデータセットに対して,ControlBurnが同等の計算コストで機能選択法よりも大幅に優れていることを示す。
- 参考スコア(独自算出の注目度): 22.430705836627155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tree ensembles distribute feature importance evenly amongst groups of
correlated features. The average feature ranking of the correlated group is
suppressed, which reduces interpretability and complicates feature selection.
In this paper we present ControlBurn, a feature selection algorithm that uses a
weighted LASSO-based feature selection method to prune unnecessary features
from tree ensembles, just as low-intensity fire reduces overgrown vegetation.
Like the linear LASSO, ControlBurn assigns all the feature importance of a
correlated group of features to a single feature. Moreover, the algorithm is
efficient and only requires a single training iteration to run, unlike
iterative wrapper-based feature selection methods. We show that ControlBurn
performs substantially better than feature selection methods with comparable
computational costs on datasets with correlated features.
- Abstract(参考訳): ツリーアンサンブルは、相関した特徴のグループ間で特徴を均等に分配する。
相関群の平均特徴ランキングが抑制され、解釈性が低下し、特徴選択が複雑になる。
本稿では,低強度火災が過剰植生を減少させるのと同じように,重み付きLASSOに基づく特徴選択法を用いて,樹木アンサンブルから不要な特徴を抽出する特徴選択アルゴリズムであるControlBurnを提案する。
線形LASSOと同様に、ControlBurnは1つの機能に関連付けられた機能のすべての重要な機能を割り当てる。
さらに、アルゴリズムは効率的であり、反復ラッパーベースの特徴選択法とは異なり、単一のトレーニングイテレーションだけを実行する。
controlburnは,相関した特徴を持つデータセットの計算コストに匹敵する特徴選択手法よりも,かなり優れた性能を示す。
関連論文リスト
- Knockoff-Guided Feature Selection via A Single Pre-trained Reinforced
Agent [44.84307718534031]
ノックオフ機能によってガイドされる特徴選択のための革新的なフレームワークを導入し、強化学習により最適化する。
探索プロセスの有効性を向上させるために,原特徴とそれに対応する擬似ラベルを事前訓練した深部Qネットワークが用いられている。
新しいepsilon-greedy戦略を使用して、擬似ラベルからの洞察を取り入れて、特徴選択プロセスをより効果的にする。
論文 参考訳(メタデータ) (2024-03-06T19:58:19Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Graph-Based Automatic Feature Selection for Multi-Class Classification
via Mean Simplified Silhouette [4.786337974720721]
本稿では,自動特徴選択のためのグラフベースの新しいフィルタ手法を提案する(略してGB-AFS)。
予測性能を維持するために必要な特徴の最小の組み合わせを決定する。
選択する機能の数など、ユーザ定義パラメータを一切必要としない。
論文 参考訳(メタデータ) (2023-09-05T14:37:31Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - ControlBurn: Nonlinear Feature Selection with Sparse Tree Ensembles [20.72259480917207]
ControlBurnは、機能スパースツリーアンサンブルを構築するPythonパッケージである。
パッケージには、アンサンブルによって選択された機能を分析する視覚化が含まれている。
論文 参考訳(メタデータ) (2022-07-08T14:37:20Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z) - Feature Selection Methods for Cost-Constrained Classification in Random
Forests [3.4806267677524896]
コストに敏感な特徴選択は、機能選択の問題であり、モデルに含めるための個々のコストを上昇させる。
ランダムフォレスト(Random Forests)は、機能選択において特に困難な問題を定義している。
小木構造から特徴を選択する新しい高速多変量特徴選択法であるShallow Tree Selectionを提案する。
論文 参考訳(メタデータ) (2020-08-14T11:39:52Z) - Infinite Feature Selection: A Graph-based Feature Filtering Approach [78.63188057505012]
グラフ内の経路として特徴のサブセットを考慮したフィルタリング機能選択フレームワークを提案する。
無限に進むことで、選択プロセスの計算複雑性を制限できる。
Inf-FSはほとんどどんな状況でも、つまり、保持するフィーチャの数が優先順位に固定されているときに、より良く振る舞うことを示す。
論文 参考訳(メタデータ) (2020-06-15T07:20:40Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。