論文の概要: Canonical-Correlation-Based Fast Feature Selection
- arxiv url: http://arxiv.org/abs/2106.08247v1
- Date: Tue, 15 Jun 2021 15:55:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 15:26:58.196787
- Title: Canonical-Correlation-Based Fast Feature Selection
- Title(参考訳): 標準相関に基づく高速特徴選択
- Authors: Sikai Zhang, Tingna Wang, Keith Worden, Elizabeth J. Cross
- Abstract要約: 特徴ランキング基準として2乗正準相関係数の和を用いる。
提案手法は,グリージー検索におけるランキング基準の計算速度を向上する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper proposes a canonical-correlation-based filter method for feature
selection. The sum of squared canonical correlation coefficients is adopted as
the feature ranking criterion. The proposed method boosts the computational
speed of the ranking criterion in greedy search. The supporting theorems
developed for the feature selection method are fundamental to the understanding
of the canonical correlation analysis. In empirical studies, a synthetic
dataset is used to demonstrate the speed advantage of the proposed method, and
eight real datasets are applied to show the effectiveness of the proposed
feature ranking criterion in both classification and regression. The results
show that the proposed method is considerably faster than the definition-based
method, and the proposed ranking criterion is competitive compared with the
seven mutual-information-based criteria.
- Abstract(参考訳): 本稿では,特徴選択のための標準相関に基づくフィルタ手法を提案する。
2乗正準相関係数の和を特徴ランキング基準として採用する。
提案手法は,グリージー検索におけるランキング基準の計算速度を向上する。
特徴選択法のために開発された支持定理は、正準相関解析の理解の基礎となる。
実験研究では,提案手法の高速化を示すために合成データセットを用い,分類と回帰の両方において,提案する特徴ランキング基準の有効性を示すために8つの実データセットを適用した。
その結果,提案手法は定義に基づく手法よりもかなり高速であり,提案手法のランク付け基準は7つの相互情報に基づく基準と競合することがわかった。
関連論文リスト
- Obtaining Explainable Classification Models using Distributionally
Robust Optimization [12.511155426574563]
特徴値規則の集合を用いて構築した一般化線形モデルについて検討する。
ルールセットの間隔と予測精度の間には、固有のトレードオフが存在する。
我々はこれらの競合する要因に同時に対処するルールセットの集合を学習するための新しい定式化を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:45:34Z) - Enriching Disentanglement: Definitions to Metrics [97.34033555407403]
分散表現学習は、複雑なデータの変動の複数の要因を分離する難題である。
不整合表現の学習と評価のための様々な指標が提案されているが、これらの指標が真に何を定量化し、どのように比較するかは定かではない。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Heuristic Search for Rank Aggregation with Application to Label Ranking [16.275063634853584]
本稿では,階層化問題を解くために,効果的なハイブリッド進化的ランキングアルゴリズムを提案する。
このアルゴリズムは、コンコーダントペアに基づくセマンティッククロスオーバーと、効率的な漸進的評価手法によって強化された遅延受容局所探索を特徴とする。
アルゴリズムを評価するために実験が行われ、ベンチマークインスタンス上での高い競争性能を示す。
論文 参考訳(メタデータ) (2022-01-11T11:43:17Z) - An Efficient and Accurate Rough Set for Feature Selection,
Classification and Knowledge Representation [89.5951484413208]
本稿では, 特徴選択, 分類, 知識表現を同時に実現する, 粗集合に基づく強力なデータマイニング手法を提案する。
まず, ノイズ特性の処理において, 粗集合の非効率性について検討し, 相対的重要度と呼ばれる特性のロバストな測定法を提案する。
公開ベンチマークデータセットによる実験結果から,提案フレームワークは7つの人気や最先端の機能選択手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2021-12-29T12:45:49Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - Building an Ensemble of Classifiers via Randomized Models of Ensemble
Members [1.827510863075184]
本稿では,ベース分類器のランダム化モデルについて述べる。
提案手法では,モデルのランダムな操作は,一定サイズの学習集合群から学習集合のランダムな選択から得られる。
67のベンチマークデータセットを用いて,提案した能力モデルを用いたDESスキームを実験的に評価した。
論文 参考訳(メタデータ) (2021-09-16T10:53:13Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Sequential Learning-based IaaS Composition [0.11470070927586014]
時間条件優先ネットワーク(TempCP-net)に含まれる決定変数
時系列類似度尺度に基づくtextitk-d tree indexingを用いて、リクエストの集合のグローバル嗜好ランキングを算出する。
構成における要求の受け入れや拒否に要求の長さを適用する、オンポリシーに基づく逐次選択学習手法を設計する。
論文 参考訳(メタデータ) (2021-02-24T23:16:01Z) - Orthogonal Least Squares Based Fast Feature Selection for Linear
Classification [0.0]
両項分類と多項分類の両方において, 直交小角(OLS)に基づく特徴選択法を提案する。
Squared Orthogonal Correlation Coefficient(SOCC)はOLSのエラー低減率(ERR)に基づいて定義され、機能ランキング基準として使用されます。
論文 参考訳(メタデータ) (2021-01-21T10:42:06Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。