論文の概要: Orthogonal Least Squares Based Fast Feature Selection for Linear
Classification
- arxiv url: http://arxiv.org/abs/2101.08539v1
- Date: Thu, 21 Jan 2021 10:42:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 08:03:34.166012
- Title: Orthogonal Least Squares Based Fast Feature Selection for Linear
Classification
- Title(参考訳): 直交最小角形を用いた線形分類のための高速特徴選択
- Authors: Sikai Zhang, Zi-Qiang Lang
- Abstract要約: 両項分類と多項分類の両方において, 直交小角(OLS)に基づく特徴選択法を提案する。
Squared Orthogonal Correlation Coefficient(SOCC)はOLSのエラー低減率(ERR)に基づいて定義され、機能ランキング基準として使用されます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: An Orthogonal Least Squares (OLS) based feature selection method is proposed
for both binomial and multinomial classification. The novel Squared Orthogonal
Correlation Coefficient (SOCC) is defined based on Error Reduction Ratio (ERR)
in OLS and used as the feature ranking criterion. The equivalence between the
canonical correlation coefficient, Fisher's criterion, and the sum of the SOCCs
is revealed, which unveils the statistical implication of ERR in OLS for the
first time. It is also shown that the OLS based feature selection method has
speed advantages when applied for greedy search. The proposed method is
comprehensively compared with the mutual information based feature selection
methods in 2 synthetic and 7 real world datasets. The results show that the
proposed method is always in the top 5 among the 10 candidate methods. Besides,
the proposed method can be directly applied to continuous features without
discretisation, which is another significant advantage over mutual information
based methods.
- Abstract(参考訳): 直交最小二乗法(ols)に基づく特徴選択法を,二項分類と多項分類の両方に対して提案する。
新規な正方形相関係数(SOCC)は、OLSの誤差削減比(ERR)に基づいて定義され、特徴ランキング基準として使用される。
標準相関係数,フィッシャーの基準,SOCCの和の等価性を明らかにし,初めてORSにおけるERRの統計的含意を明らかにした。
また,OLSに基づく特徴選択法は,欲求探索に適用した場合の速度優位性を示した。
提案手法は、2つの合成データと7つの実世界データセットにおける相互情報に基づく特徴選択手法と包括的に比較される。
その結果,提案手法は10の候補手法のうち,常に上位5位にあることがわかった。
さらに,提案手法は離散化を伴わずに連続的な特徴に対して直接適用することが可能であり,相互情報に基づく手法よりも大きな利点がある。
関連論文リスト
- Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - A Supervised Feature Selection Method For Mixed-Type Data using
Density-based Feature Clustering [1.3048920509133808]
本稿では、密度ベース特徴クラスタリング(SFSDFC)を用いた教師付き特徴選択法を提案する。
SFSDFCは、新しい密度に基づくクラスタリング法を用いて、特徴空間を不連続な特徴クラスタの集合に分解する。
そして、これらの特徴クラスタから最小限の冗長性を持つ重要な特徴のサブセットを得るために、効果的な特徴選択戦略を採用する。
論文 参考訳(メタデータ) (2021-11-10T15:05:15Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - Classification with Nearest Disjoint Centroids [6.332832782461923]
最寄りのセントロイドに基づく新しい分類法を開発し,これを最寄りのディジョイント・セントロイド分類器と呼ぶ。
本手法は次の2つの側面において最寄りのセントロイド分類器と異なる: (1) 中心ロイドはすべての特徴の代わりに特徴の解離部分集合に基づいて定義され、(2) 距離はユークリッドノルムの代わりに次元正規化ノルムによって誘導される。
論文 参考訳(メタデータ) (2021-09-21T21:16:36Z) - Canonical-Correlation-Based Fast Feature Selection [0.0]
特徴ランキング基準として2乗正準相関係数の和を用いる。
提案手法は,グリージー検索におけるランキング基準の計算速度を向上する。
論文 参考訳(メタデータ) (2021-06-15T15:55:17Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。