論文の概要: A Hybrid Two-layer Feature Selection Method Using GeneticAlgorithm and
Elastic Net
- arxiv url: http://arxiv.org/abs/2001.11177v1
- Date: Thu, 30 Jan 2020 05:01:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 11:35:35.205635
- Title: A Hybrid Two-layer Feature Selection Method Using GeneticAlgorithm and
Elastic Net
- Title(参考訳): 遺伝的アルゴリズムと弾性ネットを用いたハイブリッド2層特徴選択法
- Authors: Fatemeh Amini and Guiping Hu
- Abstract要約: 本稿では,ラッパーと組込み方式を組み合わせたハイブリッドな2層特徴選択手法を提案する。
遺伝的アルゴリズム(GA)は、予測子の最適なサブセットを探索するラッパーとして採用されている。
提案手法に第2層を追加し,残余/非関連予測器を除去し,予測精度を向上させる。
- 参考スコア(独自算出の注目度): 6.85316573653194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature selection, as a critical pre-processing step for machine learning,
aims at determining representative predictors from a high-dimensional feature
space dataset to improve the prediction accuracy. However, the increase in
feature space dimensionality, comparing to the number of observations, poses a
severe challenge to many existing feature selection methods with respect to
computational efficiency and prediction performance. This paper presents a new
hybrid two-layer feature selection approach that combines a wrapper and an
embedded method in constructing an appropriate subset of predictors. In the
first layer of the proposed method, the Genetic Algorithm(GA) has been adopted
as a wrapper to search for the optimal subset of predictors, which aims to
reduce the number of predictors and the prediction error. As one of the
meta-heuristic approaches, GA is selected due to its computational efficiency;
however, GAs do not guarantee the optimality. To address this issue, a second
layer is added to the proposed method to eliminate any remaining
redundant/irrelevant predictors to improve the prediction accuracy. Elastic
Net(EN) has been selected as the embedded method in the second layer because of
its flexibility in adjusting the penalty terms in regularization process and
time efficiency. This hybrid two-layer approach has been applied on a Maize
genetic dataset from NAM population, which consists of multiple subsets of
datasets with different ratio of the number of predictors to the number of
observations. The numerical results confirm the superiority of the proposed
model.
- Abstract(参考訳): 特徴選択は、機械学習における重要な前処理ステップとして、高次元特徴空間データセットから代表予測器を決定することを目的としており、予測精度を向上させる。
しかし,観測回数と比較して特徴空間の次元性の増大は,計算効率や予測性能に関して,既存の特徴選択手法の多くに深刻な課題をもたらす。
本稿では,予測器の適切なサブセットを構築する際に,ラッパーと組込み手法を組み合わせたハイブリッドな2層特徴選択手法を提案する。
提案手法の第1層では,予測器数と予測誤差の低減を目的とした予測器の最適部分集合を探索するラッパーとしてGAが採用されている。
メタヒューリスティックなアプローチの1つとして、GAはその計算効率から選択されるが、GAは最適性を保証しない。
この問題に対処するために,提案手法に第2層を追加し,残余/無関係予測器を除去し,予測精度を向上させる。
正則化過程におけるペナルティ項の調整と時間効率の柔軟性から、第2層では弾性ネット(en)が組込み方式として選択されている。
このハイブリッド2層アプローチは、NAM集団のMaize遺伝データセットに適用され、予測値と観測値の比率の異なるデータセットの複数のサブセットで構成されている。
その結果,提案モデルの有効性が確認された。
関連論文リスト
- Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。
我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Subject-specific Deep Neural Networks for Count Data with
High-cardinality Categorical Features [1.2289361708127877]
本稿では,ポアソンディープニューラルネットワークにガンマランダム効果を導入するための新しい階層的確率学習フレームワークを提案する。
提案手法は,固定パラメータの最大極大推定器とランダム効果の最適非バイアス予測器を同時に生成する。
最先端のネットワークアーキテクチャは、提案されたh-likelihoodフレームワークに容易に実装できる。
論文 参考訳(メタデータ) (2023-10-18T01:54:48Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。
本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。
我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文 参考訳(メタデータ) (2022-09-27T07:58:25Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Efficient first-order predictor-corrector multiple objective
optimization for fair misinformation detection [5.139559672771439]
多重目的最適化(MOO)は、複数の競合する目的を同時に最適化することを目的としており、機械学習において重要な応用を見出した。
本稿では,線形にしかスケールしないガウスニュートン近似を提案し,イテレーション毎に一階内積しか必要としない。
このイノベーションは、大規模ネットワークで予測器のコレクタを可能にする。
論文 参考訳(メタデータ) (2022-09-15T12:32:15Z) - Consensual Aggregation on Random Projected High-dimensional Features for
Regression [0.0]
本稿では,ランダムに投影された回帰予測の高次元的特徴に対するカーネルベースの合意アグリゲーションについて検討する。
集約方式は, 非常に大きく, 高い相関性を持つ特徴に対して, その性能を保っていることを数値的に説明する。
提案手法の効率性は,様々な種類の合成データセットと実データセットで評価されたいくつかの実験を通して説明される。
論文 参考訳(メタデータ) (2022-04-06T06:35:47Z) - Accelerating Stochastic Probabilistic Inference [1.599072005190786]
変分推論(SVI)は確率モデルの良好な後部近似を求める能力により、ますます魅力的になっている。
最先端のSVIアルゴリズムのほとんど全てが一階最適化に基づいており、しばしば収束率の低下に悩まされている。
我々は二階法と変分推論のギャップを二階法に基づく変分推論手法によって埋める。
論文 参考訳(メタデータ) (2022-03-15T01:19:12Z) - Efficient and Differentiable Conformal Prediction with General Function
Classes [96.74055810115456]
本稿では,複数の学習可能なパラメータに対する共形予測の一般化を提案する。
本研究は, クラス内において, ほぼ有効な人口被覆率, ほぼ最適効率を実現していることを示す。
実験の結果,提案アルゴリズムは有効な予測セットを学習し,効率を著しく向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-22T18:37:23Z) - Efficient Ensemble Model Generation for Uncertainty Estimation with
Bayesian Approximation in Segmentation [74.06904875527556]
アンサンブルセグメンテーションモデルを構築するための汎用的で効率的なセグメンテーションフレームワークを提案する。
提案手法では,層選択法を用いて効率よくアンサンブルモデルを生成することができる。
また,新たな画素単位の不確実性損失を考案し,予測性能を向上する。
論文 参考訳(メタデータ) (2020-05-21T16:08:38Z) - Gaussian Process Boosting [13.162429430481982]
ガウス過程と混合効果モデルを組み合わせた新しい手法を提案する。
シミュレーションおよび実世界のデータセットに対する既存手法と比較して予測精度が向上する。
論文 参考訳(メタデータ) (2020-04-06T13:19:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。