論文の概要: Orthogonal Least Squares Based Fast Feature Selection for Linear
Classification
- arxiv url: http://arxiv.org/abs/2101.08539v1
- Date: Thu, 21 Jan 2021 10:42:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 08:03:34.166012
- Title: Orthogonal Least Squares Based Fast Feature Selection for Linear
Classification
- Title(参考訳): 直交最小角形を用いた線形分類のための高速特徴選択
- Authors: Sikai Zhang, Zi-Qiang Lang
- Abstract要約: 両項分類と多項分類の両方において, 直交小角(OLS)に基づく特徴選択法を提案する。
Squared Orthogonal Correlation Coefficient(SOCC)はOLSのエラー低減率(ERR)に基づいて定義され、機能ランキング基準として使用されます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: An Orthogonal Least Squares (OLS) based feature selection method is proposed
for both binomial and multinomial classification. The novel Squared Orthogonal
Correlation Coefficient (SOCC) is defined based on Error Reduction Ratio (ERR)
in OLS and used as the feature ranking criterion. The equivalence between the
canonical correlation coefficient, Fisher's criterion, and the sum of the SOCCs
is revealed, which unveils the statistical implication of ERR in OLS for the
first time. It is also shown that the OLS based feature selection method has
speed advantages when applied for greedy search. The proposed method is
comprehensively compared with the mutual information based feature selection
methods in 2 synthetic and 7 real world datasets. The results show that the
proposed method is always in the top 5 among the 10 candidate methods. Besides,
the proposed method can be directly applied to continuous features without
discretisation, which is another significant advantage over mutual information
based methods.
- Abstract(参考訳): 直交最小二乗法(ols)に基づく特徴選択法を,二項分類と多項分類の両方に対して提案する。
新規な正方形相関係数(SOCC)は、OLSの誤差削減比(ERR)に基づいて定義され、特徴ランキング基準として使用される。
標準相関係数,フィッシャーの基準,SOCCの和の等価性を明らかにし,初めてORSにおけるERRの統計的含意を明らかにした。
また,OLSに基づく特徴選択法は,欲求探索に適用した場合の速度優位性を示した。
提案手法は、2つの合成データと7つの実世界データセットにおける相互情報に基づく特徴選択手法と包括的に比較される。
その結果,提案手法は10の候補手法のうち,常に上位5位にあることがわかった。
さらに,提案手法は離散化を伴わずに連続的な特徴に対して直接適用することが可能であり,相互情報に基づく手法よりも大きな利点がある。
関連論文リスト
- Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - A Supervised Feature Selection Method For Mixed-Type Data using
Density-based Feature Clustering [1.3048920509133808]
本稿では、密度ベース特徴クラスタリング(SFSDFC)を用いた教師付き特徴選択法を提案する。
SFSDFCは、新しい密度に基づくクラスタリング法を用いて、特徴空間を不連続な特徴クラスタの集合に分解する。
そして、これらの特徴クラスタから最小限の冗長性を持つ重要な特徴のサブセットを得るために、効果的な特徴選択戦略を採用する。
論文 参考訳(メタデータ) (2021-11-10T15:05:15Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Classification with Nearest Disjoint Centroids [6.332832782461923]
最寄りのセントロイドに基づく新しい分類法を開発し,これを最寄りのディジョイント・セントロイド分類器と呼ぶ。
本手法は次の2つの側面において最寄りのセントロイド分類器と異なる: (1) 中心ロイドはすべての特徴の代わりに特徴の解離部分集合に基づいて定義され、(2) 距離はユークリッドノルムの代わりに次元正規化ノルムによって誘導される。
論文 参考訳(メタデータ) (2021-09-21T21:16:36Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Selective Classification via One-Sided Prediction [54.05407231648068]
片側予測(OSP)に基づく緩和は、実際に関係する高目標精度体制において、ほぼ最適カバレッジが得られるSCスキームをもたらす。
理論的には,SCとOSPのバウンダリ一般化を導出し,その手法が小さな誤差レベルでのカバレッジにおいて,技術手法の状態を強く上回ることを示す。
論文 参考訳(メタデータ) (2020-10-15T16:14:27Z) - Gaussian Process Models with Low-Rank Correlation Matrices for Both
Continuous and Categorical Inputs [0.0]
混合連続および分類ガウス過程モデルにおけるクロス相関行列の低ランク近似を用いた手法を提案する。
低ランク相関(LRC)は、近似の適切なランクを選択することで、問題のパラメータの数に柔軟に適応する能力を提供する。
論文 参考訳(メタデータ) (2020-10-06T09:38:35Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z) - A sparsity augmented probabilistic collaborative representation based
classification method [0.76146285961466]
空間的拡張確率的協調表現に基づく分類法(SA-ProCRC)を提案する。
実験結果から,提案手法は顔画像やシーン画像に対して有望な結果が得られることが示唆された。
論文 参考訳(メタデータ) (2019-12-27T10:06:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。