論文の概要: RaSE: Random Subspace Ensemble Classification
- arxiv url: http://arxiv.org/abs/2006.08855v3
- Date: Sat, 29 May 2021 15:54:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 20:57:21.446983
- Title: RaSE: Random Subspace Ensemble Classification
- Title(参考訳): rase: ランダム部分空間アンサンブルの分類
- Authors: Ye Tian and Yang Feng
- Abstract要約: スパース分類のためのフレキシブルアンサンブル分類フレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEアルゴリズムでは、多くの弱い学習者を集約し、各弱い学習者はランダムな部分空間の集合から最適に選択された部分空間で訓練された基底分類器である。
高次元のフレームワークでは、信号をカバーする部分空間が選択されることを保証するために、乱部分空間の数が非常に大きい必要がある。
- 参考スコア(独自算出の注目度): 12.599368232426631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a flexible ensemble classification framework, Random Subspace
Ensemble (RaSE), for sparse classification. In the RaSE algorithm, we aggregate
many weak learners, where each weak learner is a base classifier trained in a
subspace optimally selected from a collection of random subspaces. To conduct
subspace selection, we propose a new criterion, ratio information criterion
(RIC), based on weighted Kullback-Leibler divergence. The theoretical analysis
includes the risk and Monte-Carlo variance of the RaSE classifier, establishing
the screening consistency and weak consistency of RIC, and providing an upper
bound for the misclassification rate of the RaSE classifier. In addition, we
show that in a high-dimensional framework, the number of random subspaces needs
to be very large to guarantee that a subspace covering signals is selected.
Therefore, we propose an iterative version of the RaSE algorithm and prove that
under some specific conditions, a smaller number of generated random subspaces
are needed to find a desirable subspace through iteration. An array of
simulations under various models and real-data applications demonstrate the
effectiveness and robustness of the RaSE classifier and its iterative version
in terms of low misclassification rate and accurate feature ranking. The RaSE
algorithm is implemented in the R package RaSEn on CRAN.
- Abstract(参考訳): スパース分類のためのフレキシブルアンサンブル分類フレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEアルゴリズムでは、多くの弱い学習者を集約し、各弱い学習者はランダムな部分空間の集合から最適に選択された部分空間で訓練された基底分類器である。
部分空間選択を行うために,重み付きKullback-Leibler分散に基づく新しい基準,比情報基準(RIC)を提案する。
理論的解析には、RaSE分類器のリスクとモンテカルロ分散、RICのスクリーニング一貫性と弱い一貫性を確立し、RaSE分類器の誤分類率の上限を与える。
さらに, 高次元の枠組みにおいて, ランダムな部分空間の個数は, 信号が選択されていることを保証するために非常に大きい必要があることを示す。
そこで我々は,RaSEアルゴリズムの反復バージョンを提案し,特定の条件下では,所望の部分空間を見つけるために,より少ない数の乱部分空間を生成する必要があることを証明した。
各種モデルおよび実データに基づくシミュレーションでは,低誤分類率と正確な特徴ランキングの観点から,RaSE分類器とその反復版の有効性とロバスト性を示す。
RaSE アルゴリズムは CRAN 上の R パッケージ RaSEn に実装されている。
関連論文リスト
- Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Supervised Multivariate Learning with Simultaneous Feature Auto-grouping
and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。
2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。
低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文 参考訳(メタデータ) (2021-12-17T20:11:20Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Distributed Adaptive Nearest Neighbor Classifier: Algorithm and Theory [6.696267547013535]
そこで本研究では,データ駆動基準によりパラメータ選択された,近接する隣人の数がパラメータとなる分散適応型NN分類器を提案する。
有限標本性能を向上する最適チューニングパラメータを探索する際,早期停止規則を提案する。
特に、サブサンプルサイズが十分に大きい場合、提案した分類器がほぼ最適な収束率を達成することを示す。
論文 参考訳(メタデータ) (2021-05-20T14:38:41Z) - RaSE: A Variable Screening Framework via Random Subspace Ensembles [7.675822266933702]
可変スクリーニングのための新しいフレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEは、複数の予測器をカバーする可能性のあるランダム部分空間の品質を評価することで機能する。
確実なスクリーニング特性とランク一貫性を享受できることが示されている。
論文 参考訳(メタデータ) (2021-02-07T19:24:52Z) - Real Elliptically Skewed Distributions and Their Application to Robust
Cluster Analysis [5.137336092866906]
本稿では,Really Skewed(RESK)分布と関連するクラスタリングアルゴリズムの新しいクラスを提案する。
非対称分散および重み付きデータクラスタは、様々な現実世界のアプリケーションで報告されている。
論文 参考訳(メタデータ) (2020-06-30T10:44:39Z) - Sharp Statistical Guarantees for Adversarially Robust Gaussian
Classification [54.22421582955454]
逆向きに頑健な分類の過剰リスクに対する最適ミニマックス保証の最初の結果を提供する。
結果はAdvSNR(Adversarial Signal-to-Noise Ratio)の項で述べられており、これは標準的な線形分類と逆数設定との類似の考え方を一般化している。
論文 参考訳(メタデータ) (2020-06-29T21:06:52Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Searching towards Class-Aware Generators for Conditional Generative
Adversarial Networks [132.29772160843825]
条件付き生成逆数ネットワーク(cGAN)は,その条件に基づいて画像を生成するように設計されている。
既存のメソッドは、すべてのクラスで同じ生成アーキテクチャを使っている。
本稿では,各クラスごとに異なるアーキテクチャを見つけるためにNASを採用する新しいアイデアを提案する。
論文 参考訳(メタデータ) (2020-06-25T07:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。