論文の概要: Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants
- arxiv url: http://arxiv.org/abs/2004.08217v1
- Date: Fri, 17 Apr 2020 12:47:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 12:39:34.849233
- Title: Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants
- Title(参考訳): ランダムに投影された線形判別式の漸近解析
- Authors: Lama B. Niyazi, Abla Kammoun, Hayssam Dahrouj, Mohamed-Slim Alouini,
and Tareq Y. Al-Naffouri
- Abstract要約: [1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
- 参考スコア(独自算出の注目度): 94.46276668068327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Datasets from the fields of bioinformatics, chemometrics, and face
recognition are typically characterized by small samples of high-dimensional
data. Among the many variants of linear discriminant analysis that have been
proposed in order to rectify the issues associated with classification in such
a setting, the classifier in [1], composed of an ensemble of randomly projected
linear discriminants, seems especially promising; it is computationally
efficient and, with the optimal projection dimension parameter setting, is
competitive with the state-of-the-art. In this work, we seek to further
understand the behavior of this classifier through asymptotic analysis. Under
the assumption of a growth regime in which the dataset and projection
dimensions grow at constant rates to each other, we use random matrix theory to
derive asymptotic misclassification probabilities showing the effect of the
ensemble as a regularization of the data sample covariance matrix. The
asymptotic errors further help to identify situations in which the ensemble
offers a performance advantage. We also develop a consistent estimator of the
misclassification probability as an alternative to the computationally-costly
cross-validation estimator, which is conventionally used for parameter tuning.
Finally, we demonstrate the use of our estimator for tuning the projection
dimension on both real and synthetic data.
- Abstract(参考訳): バイオインフォマティクス、化学計測、顔認識の分野からのデータセットは通常、高次元データの小さなサンプルによって特徴づけられる。
このような設定で分類に関連する問題を正すために提案された線形判別分析の多くの変種のうち、ランダムに投影された線形判別式のアンサンブルからなる[1]の分類器は、特に有望であり、計算効率が高く、最適な射影次元パラメータ設定では最先端と競合している。
本研究では,この分類器の動作を漸近解析によりさらに理解することを目的とする。
データセットと投影次元が互いに一定の速度で成長する成長状態の仮定の下で、ランダム行列理論を用いて、データサンプル共分散行列の正規化としてアンサンブルの効果を示す漸近的誤分類確率を導出する。
漸近的エラーはさらに、アンサンブルがパフォーマンス上の優位性をもたらす状況を特定するのに役立つ。
また,従来パラメータチューニングに用いられてきた計算コストのクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発した。
最後に,実データと合成データの両方に投影次元をチューニングするための推定器の使用例を示す。
関連論文リスト
- Statistical Inference in Classification of High-dimensional Gaussian Mixture [1.2354076490479515]
高次元極限における正規化凸分類器の一般クラスの挙動について検討する。
我々の焦点は、推定器の一般化誤差と変数選択性である。
論文 参考訳(メタデータ) (2024-10-25T19:58:36Z) - Regularized Projection Matrix Approximation with Applications to Community Detection [1.3761665705201904]
本稿では,アフィニティ行列からクラスタ情報を復元するための正規化プロジェクション行列近似フレームワークを提案する。
3つの異なるペナルティ関数について検討し, それぞれが有界, 正, スパースシナリオに対応するように調整した。
合成および実世界の両方のデータセットで行った数値実験により、我々の正規化射影行列近似アプローチはクラスタリング性能において最先端の手法を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-05-26T15:18:22Z) - Uncertainty quantification in metric spaces [3.637162892228131]
本稿では、応答が分離可能な距離空間で値を取る回帰モデルのための新しい不確実性定量化フレームワークを提案する。
提案アルゴリズムは,大規模データセットを効率的に処理し,使用する予測ベースモデルに依存しない。
論文 参考訳(メタデータ) (2024-05-08T15:06:02Z) - Spectral Estimators for Structured Generalized Linear Models via Approximate Message Passing [28.91482208876914]
本研究では,高次元一般化線形モデルにおけるパラメータ推定の問題について考察する。
広く使われているにもかかわらず、厳密なパフォーマンス特性とデータ前処理の原則が、構造化されていない設計でのみ利用可能である。
論文 参考訳(メタデータ) (2023-08-28T11:49:23Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Weight Vector Tuning and Asymptotic Analysis of Binary Linear
Classifiers [82.5915112474988]
本稿では,スカラーによる判別器の分解をパラメータ化することで,ジェネリックバイナリ線形分類器の重みベクトルチューニングを提案する。
また,重みベクトルチューニングは,高推定雑音下での線形判別分析(LDA)の性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2021-10-01T17:50:46Z) - Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。
新規な構造化融合正規化に基づく一般グラフ推定器を提案する。
提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文 参考訳(メタデータ) (2021-03-05T04:42:32Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。