論文の概要: Beam Search for Feature Selection
- arxiv url: http://arxiv.org/abs/2203.04350v1
- Date: Tue, 8 Mar 2022 19:17:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 14:18:04.235943
- Title: Beam Search for Feature Selection
- Title(参考訳): 特徴選択のためのビーム探索
- Authors: Nicolas Fraiman, Zichao Li
- Abstract要約: 特徴のサブセットを用いた分類モデルの性能について、一貫性のある結果を示し、証明する。
本稿では,ビームサーチを用いて特徴選択を行い,前方選択の一般化とみなす。
- 参考スコア(独自算出の注目度): 5.089110111757978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present and prove some consistency results about the
performance of classification models using a subset of features. In addition,
we propose to use beam search to perform feature selection, which can be viewed
as a generalization of forward selection. We apply beam search to both
simulated and real-world data, by evaluating and comparing the performance of
different classification models using different sets of features. The results
demonstrate that beam search could outperform forward selection, especially
when the features are correlated so that they have more discriminative power
when considered jointly than individually. Moreover, in some cases
classification models could obtain comparable performance using only ten
features selected by beam search instead of hundreds of original features.
- Abstract(参考訳): 本稿では,特徴のサブセットを用いた分類モデルの性能について,一貫性のある結果を示す。
さらに,前方選択の一般化と見なすことのできる特徴選択を行うために,ビーム探索の利用を提案する。
シミュレーションデータと実世界データの両方にビームサーチを適用し,様々な特徴を用いた分類モデルの性能評価と比較を行った。
その結果, ビーム探索は, 個々に考えるよりも識別力が高いように特徴が相関している場合において, 前方探索よりも優れることがわかった。
さらに、分類モデルは、数百の原特徴ではなく、ビームサーチによって選択された10の特徴のみを用いて、同等のパフォーマンスを得ることができた。
関連論文リスト
- LLM-Select: Feature Selection with Large Language Models [64.5099482021597]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文 参考訳(メタデータ) (2024-07-02T22:23:40Z) - Greedy feature selection: Classifier-dependent feature selection via
greedy methods [2.4374097382908477]
本研究の目的は, グリージーな特徴選択に追随する特徴選択と呼ばれる, 分類タスクにおける特徴ランク付けのための新しいアプローチを導入することである。
このようなスキームの利点は、Vapnik-Chervonenkis(VC)次元やカーネルアライメントといったモデルキャパシティインジケータの観点から理論的に研究されている。
論文 参考訳(メタデータ) (2024-03-08T08:12:05Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Automated Model Selection for Tabular Data [0.1797555376258229]
Rの混合効果線形モデルライブラリは、モデル設計において対話的な機能の組み合わせを提供することができる。
特徴的相互作用を取り入れたデータセットの予測のためのモデル選択プロセスを自動化することを目的としている。
このフレームワークには、優先順位に基づくランダムグリッド検索とグレディ検索という、2つの異なる機能選択のアプローチが含まれている。
論文 参考訳(メタデータ) (2024-01-01T21:41:20Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - Utilizing Semantic Textual Similarity for Clinical Survey Data Feature
Selection [4.5574502769585745]
調査データから結果を予測する機械学習モデルは、過度に適合し、結果として一般化性が低下する可能性がある。
この機能の選択は、学習する機能の最適なサブセットを選択しようとするものだ。
特徴名と対象名の関係を言語モデル(LM)を用いて評価し,意味的テキスト類似度(STS)スコアを生成する。
STSを用いて最小冗長-最大関連性(mRMR)アルゴリズムで特徴を直接選択する性能について検討する。
論文 参考訳(メタデータ) (2023-08-19T03:10:51Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Dynamic Instance-Wise Classification in Correlated Feature Spaces [15.351282873821935]
典型的な機械学習環境では、すべてのテストインスタンスの予測は、モデルトレーニング中に発見された機能の共通サブセットに基づいている。
それぞれのテストインスタンスに対して個別に評価する最適な特徴を順次選択し、分類精度に関して更なる改善が得られないことを判断すると、選択プロセスが終了して予測を行う新しい手法を提案する。
提案手法の有効性, 一般化性, 拡張性について, 多様なアプリケーション領域の様々な実世界のデータセットで説明する。
論文 参考訳(メタデータ) (2021-06-08T20:20:36Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z) - Outlier Detection Ensemble with Embedded Feature Selection [42.8338013000469]
組込み特徴選択(ODEFS)を用いた外乱検出アンサンブルフレームワークを提案する。
各ランダムなサブサンプリングベースの学習コンポーネントに対して、ODEFSは、特徴選択と外れ値検出をペアのランキング式に統一する。
我々は、特徴選択と例選択を同時に最適化するために閾値付き自己評価学習を採用する。
論文 参考訳(メタデータ) (2020-01-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。