論文の概要: Elastic Net based Feature Ranking and Selection
- arxiv url: http://arxiv.org/abs/2012.14982v1
- Date: Wed, 30 Dec 2020 00:08:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 05:55:26.685378
- Title: Elastic Net based Feature Ranking and Selection
- Title(参考訳): 弾性ネットによる特徴ランク付けと選択
- Authors: Shaode Yu, Haobo Chen, Hang Yu, Zhicheng Zhang, Xiaokun Liang, Wenjian
Qin, Yaoqin Xie, Ping Shi
- Abstract要約: 直感的なアイデアは、データ分割と弾性ネットベースの機能選択の複数回の終わりに置かれます。
選択された特徴の頻度に関係し、特徴の重要性を示す指標として周波数を使用する。
elastic netとの競争力や優れたパフォーマンスを実現し、より少ない機能の一貫した選択を実現します。
- 参考スコア(独自算出の注目度): 9.289190508925875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature selection is important in data representation and intelligent
diagnosis. Elastic net is one of the most widely used feature selectors.
However, the features selected are dependant on the training data, and their
weights dedicated for regularized regression are irrelevant to their importance
if used for feature ranking, that degrades the model interpretability and
extension. In this study, an intuitive idea is put at the end of multiple times
of data splitting and elastic net based feature selection. It concerns the
frequency of selected features and uses the frequency as an indicator of
feature importance. After features are sorted according to their frequency,
linear support vector machine performs the classification in an incremental
manner. At last, a compact subset of discriminative features is selected by
comparing the prediction performance. Experimental results on breast cancer
data sets (BCDR-F03, WDBC, GSE 10810, and GSE 15852) suggest that the proposed
framework achieves competitive or superior performance to elastic net and with
consistent selection of fewer features. How to further enhance its consistency
on high-dimension small-sample-size data sets should be paid more attention in
our future work. The proposed framework is accessible online
(https://github.com/NicoYuCN/elasticnetFR).
- Abstract(参考訳): 特徴選択はデータ表現とインテリジェントな診断において重要である。
Elastic netは最も広く使われている機能セレクタの1つである。
しかしながら、選択された特徴はトレーニングデータに依存しており、正規化回帰専用の重み付けは、特徴ランキングに使用される場合の重要性に関係せず、モデル解釈可能性と拡張性が低下する。
本研究では,データ分割と弾性ネットによる特徴選択を複数回行った結果,直感的なアイデアが得られた。
選択された特徴の頻度に関係し、特徴の重要性を示す指標として周波数を使用する。
特徴量を周波数順にソートした後、線形支持ベクトルマシンは漸進的に分類を行う。
最終的に、予測性能を比較して識別特徴のコンパクトなサブセットを選択する。
乳がんデータセット (BCDR-F03, WDBC, GSE 10810, GSE 15852) の実験結果から, 提案フレームワークは弾力性ネットに対する競争力や優れた性能を達成し, より少ない特徴を連続的に選択できることが示唆された。
高次元の小型データセットの一貫性をさらに強化するには、今後の作業にもっと注意を払う必要がある。
提案されたフレームワークはオンラインでアクセスできる(https://github.com/nicoyucn/elasticnetfr)。
関連論文リスト
- Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - i-Razor: A Neural Input Razor for Feature Selection and Dimension Search
in Large-Scale Recommender Systems [11.655546017122898]
ノイズのある特徴や不適切な埋め込み次元の割り当ては、レコメンダシステムの性能を損なう可能性がある。
それぞれの特徴の異なる埋め込み領域間の相対的重要性を学習するために、エンド・ツー・エンドの微分モデルを導入する。
CTR(Click-Through-Rate)予測タスクにおける2つの大規模な公開データセットの実験は、i-Razorの有効性と優位性を示している。
論文 参考訳(メタデータ) (2022-04-01T08:30:06Z) - VFDS: Variational Foresight Dynamic Selection in Bayesian Neural
Networks for Efficient Human Activity Recognition [81.29900407096977]
変動予測動的選択(VFDS)は、観測する次の機能サブセットを選択するポリシーを学ぶ。
本稿では,その実践においてパフォーマンスコストのトレードオフが重要となるヒューマンアクティビティ認識(HAR)タスクに,VFDSを適用した。
論文 参考訳(メタデータ) (2022-03-31T22:52:43Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [73.02413694753423]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Online Active Learning with Dynamic Marginal Gain Thresholding [72.62466575649879]
我々は,任意のデータストリームに対して,ストリームの最も価値の高いサブセットを一定要素まで抽出するオンラインアルゴリズムを提案する。
ImageNet と MNIST の予測タスクでは,提案手法が最大 5-20% のランダム選択より優れていることを示す。
論文 参考訳(メタデータ) (2022-01-25T18:56:16Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - Dynamic Instance-Wise Classification in Correlated Feature Spaces [15.351282873821935]
典型的な機械学習環境では、すべてのテストインスタンスの予測は、モデルトレーニング中に発見された機能の共通サブセットに基づいている。
それぞれのテストインスタンスに対して個別に評価する最適な特徴を順次選択し、分類精度に関して更なる改善が得られないことを判断すると、選択プロセスが終了して予測を行う新しい手法を提案する。
提案手法の有効性, 一般化性, 拡張性について, 多様なアプリケーション領域の様々な実世界のデータセットで説明する。
論文 参考訳(メタデータ) (2021-06-08T20:20:36Z) - A User-Guided Bayesian Framework for Ensemble Feature Selection in Life
Science Applications (UBayFS) [0.0]
本稿では,ベイズ統計フレームワークに組み込んだアンサンブル特徴選択手法UBayFSを提案する。
提案手法は,データとドメイン知識の2つの情報源を考慮し,特徴選択のプロセスを強化する。
標準的な機能セレクタとの比較では、UBayFSは競争力のあるパフォーマンスを実現し、ドメイン知識を組み込むための柔軟性を提供する。
論文 参考訳(メタデータ) (2021-04-30T06:51:33Z) - A Feature Selection Method for Multi-Dimension Time-Series Data [2.055949720959582]
モーションキャプチャやアクティビティ認識などのアプリケーション領域の時系列データは、しばしば多次元である。
これらのデータストリームには多くの冗長性があり、優れた分類精度は少数の機能で達成できることが多い。
相互情報に基づく多次元時系列データにおける特徴部分選択法を提案する。
論文 参考訳(メタデータ) (2021-04-22T14:49:00Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。