論文の概要: Subspace Learning for Feature Selection via Rank Revealing QR
Factorization: Unsupervised and Hybrid Approaches with Non-negative Matrix
Factorization and Evolutionary Algorithm
- arxiv url: http://arxiv.org/abs/2210.00418v1
- Date: Sun, 2 Oct 2022 04:04:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 13:30:00.438751
- Title: Subspace Learning for Feature Selection via Rank Revealing QR
Factorization: Unsupervised and Hybrid Approaches with Non-negative Matrix
Factorization and Evolutionary Algorithm
- Title(参考訳): ランクRevealing QR Factorizationによる特徴選択のためのサブスペース学習:非負行列因子化と進化的アルゴリズムによる教師なしハイブリッドアプローチ
- Authors: Amir Moslemi, Arash Ahmadian
- Abstract要約: ランク明示QR(RRQR)因子化は、新しい教師なし特徴選択技術として最も情報性の高い特徴を得るのに活用される。
フィルタベース手法としてRRQRとラッパーベース手法として遺伝的アルゴリズムを組み合わせたハイブリッド特徴選択アルゴリズムを提案する。
提案アルゴリズムは、教師付き、教師なし、および半教師付き設定における最先端の特徴選択アルゴリズムと比較した場合、信頼性と堅牢性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The selection of most informative and discriminative features from
high-dimensional data has been noticed as an important topic in machine
learning and data engineering. Using matrix factorization-based techniques such
as nonnegative matrix factorization for feature selection has emerged as a hot
topic in feature selection. The main goal of feature selection using matrix
factorization is to extract a subspace which approximates the original space
but in a lower dimension. In this study, rank revealing QR (RRQR)
factorization, which is computationally cheaper than singular value
decomposition (SVD), is leveraged in obtaining the most informative features as
a novel unsupervised feature selection technique. This technique uses the
permutation matrix of QR for feature selection which is a unique property to
this factorization method. Moreover, QR factorization is embedded into
non-negative matrix factorization (NMF) objective function as a new
unsupervised feature selection method. Lastly, a hybrid feature selection
algorithm is proposed by coupling RRQR, as a filter-based technique, and a
Genetic algorithm as a wrapper-based technique. In this method, redundant
features are removed using RRQR factorization and the most discriminative
subset of features are selected using the Genetic algorithm. The proposed
algorithm shows to be dependable and robust when compared against
state-of-the-art feature selection algorithms in supervised, unsupervised, and
semi-supervised settings. All methods are tested on seven available microarray
datasets using KNN, SVM and C4.5 classifiers. In terms of evaluation metrics,
the experimental results shows that the proposed method is comparable with the
state-of-the-art feature selection.
- Abstract(参考訳): 高次元データからの最も有益で識別的な特徴の選択は、機械学習とデータエンジニアリングにおいて重要なトピックとして注目されている。
特徴選択のための非負行列分解のような行列分解に基づく手法が特徴選択のホットトピックとして登場した。
行列分解を用いた特徴選択の主な目標は、元の空間を近似する部分空間を低次元で抽出することである。
本研究では,特異値分解 (SVD) よりも計算的に安価であるQR (RRQR) 係数化を,新しい教師なし特徴選択手法として,最も情報性の高い特徴の獲得に活用する。
本手法は,この因子分解法に特有の特徴である特徴選択にqrの置換行列を用いる。
さらに、新しい教師なし特徴選択法として、QR因子化を非負行列分解(NMF)目的関数に組み込む。
最後に,フィルタベース手法としてrrqr,ラッパーベース手法として遺伝的アルゴリズムを結合したハイブリッド特徴選択アルゴリズムを提案する。
本手法では、RRQR因子化を用いて冗長な特徴を除去し、遺伝的アルゴリズムを用いて最も識別性の高い特徴サブセットを選択する。
提案アルゴリズムは、教師付き、教師なし、および半教師付き設定における最先端の特徴選択アルゴリズムと比較した場合、信頼性と堅牢性を示す。
すべてのメソッドは、KNN、SVM、C4.5分類器を使用して利用可能な7つのマイクロアレイデータセットでテストされる。
評価指標の観点からは,提案手法が最先端の機能選択に匹敵することを示す。
関連論文リスト
- Large-scale Multi-objective Feature Selection: A Multi-phase Search Space Shrinking Approach [0.27624021966289597]
特徴の選択は、特に高次元データセットにおいて、機械学習において重要なステップである。
本稿では,LMSSSと呼ばれる探索空間の縮小に基づく大規模多目的進化アルゴリズムを提案する。
提案アルゴリズムの有効性は、15の大規模データセットに対する包括的実験によって実証される。
論文 参考訳(メタデータ) (2024-10-13T23:06:10Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Gram-Schmidt Methods for Unsupervised Feature Extraction and Selection [7.373617024876725]
本稿では,関数空間上のGram-Schmidtプロセスを提案する。
合成および実世界のベンチマークデータセットに対する実験結果を提供する。
驚いたことに、線形特徴抽出アルゴリズムは同等であり、しばしば重要な非線形特徴抽出法よりも優れている。
論文 参考訳(メタデータ) (2023-11-15T21:29:57Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Feature Weighted Non-negative Matrix Factorization [92.45013716097753]
本稿では,FNMF(Feature weighted Non- negative Matrix Factorization)を提案する。
FNMFはその重要性に応じて特徴の重みを適応的に学習する。
提案する最適化アルゴリズムを用いて効率的に解くことができる。
論文 参考訳(メタデータ) (2021-03-24T21:17:17Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Adaptive Graph-based Generalized Regression Model for Unsupervised
Feature Selection [11.214334712819396]
非相関的かつ識別的特徴の選択は、教師なしの機能選択の重要な問題である。
非相関制約と $ell_2,1$-norm 正規化によって課される新しい一般化回帰モデルを提案する。
それは同時に同じ近所に属するこれらのデータ ポイントの分散を減らすこと無相関および差別的な特徴を選ぶことができます。
論文 参考訳(メタデータ) (2020-12-27T09:07:26Z) - Robust Multi-class Feature Selection via $l_{2,0}$-Norm Regularization
Minimization [6.41804410246642]
特徴選択は、データマイニングと機械学習において重要な計算処理である。
本稿では,複数クラスの特徴選択における最小二乗問題の解法として,ホモシーハードしきい値(HIHT)に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-08T02:06:06Z) - Augmentation of the Reconstruction Performance of Fuzzy C-Means with an
Optimized Fuzzification Factor Vector [99.19847674810079]
Fuzzy C-Means (FCM) は情報グラニュラーを構成する最も頻繁に使用される手法の1つである。
本稿では, ファジィ化因子のベクトルを導入することにより, FCMに基づく脱顆粒機構を増強する。
合成データセットと公開データセットの両方で実験が完了し、提案手法が汎用データ再構成手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-04-13T04:17:30Z) - Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。
本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-02-08T21:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。