論文の概要: Kernel PCA for multivariate extremes
- arxiv url: http://arxiv.org/abs/2211.13172v2
- Date: Thu, 24 Nov 2022 02:58:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 12:07:54.594599
- Title: Kernel PCA for multivariate extremes
- Title(参考訳): 多変量極小に対するカーネルPCA
- Authors: Marco Avella-Medina, Richard A. Davis and Gennady Samorodnitsky
- Abstract要約: カーネルPCAはクラスタリングと次元削減のための強力なツールであることを示す。
極端サンプルに基づくカーネルPCAの性能に関する理論的保証を与える。
本手法の有限性能を実証する数値実験により,本研究の成果を補完する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose kernel PCA as a method for analyzing the dependence structure of
multivariate extremes and demonstrate that it can be a powerful tool for
clustering and dimension reduction. Our work provides some theoretical insight
into the preimages obtained by kernel PCA, demonstrating that under certain
conditions they can effectively identify clusters in the data. We build on
these new insights to characterize rigorously the performance of kernel PCA
based on an extremal sample, i.e., the angular part of random vectors for which
the radius exceeds a large threshold. More specifically, we focus on the
asymptotic dependence of multivariate extremes characterized by the angular or
spectral measure in extreme value theory and provide a careful analysis in the
case where the extremes are generated from a linear factor model. We give
theoretical guarantees on the performance of kernel PCA preimages of such
extremes by leveraging their asymptotic distribution together with Davis-Kahan
perturbation bounds. Our theoretical findings are complemented with numerical
experiments illustrating the finite sample performance of our methods.
- Abstract(参考訳): 多変量極端の依存構造を解析する手法としてカーネルPCAを提案し、クラスタリングと次元減少のための強力なツールであることを示す。
我々の研究は、カーネルPCAによって得られた事前イメージに関する理論的知見を提供し、ある条件下では、データ内のクラスタを効果的に識別できることを実証する。
我々は、これらの新しい洞察に基づいて、極端サンプル、すなわち半径が大きなしきい値を超えるランダムベクトルの角部に基づいて、カーネルPCAの性能を厳密に特徴づける。
より具体的には、極値理論における角あるいはスペクトル測度によって特徴づけられる多変量極値の漸近依存に注目し、極値が線形因子モデルから生成される場合の注意深い解析を提供する。
カーネルPCAがそれらの漸近分布をデイビス・カハン摂動境界とともに活用することにより、そのような極端の予測性能を理論的に保証する。
本手法の有限サンプル性能を実証する数値実験により, 理論的知見を補完する。
関連論文リスト
- High-Dimensional Kernel Methods under Covariate Shift: Data-Dependent Implicit Regularization [83.06112052443233]
本稿では,共変量シフト下での高次元におけるカーネルリッジの回帰について検討する。
バイアス分散分解により、再重み付け戦略が分散を減少させることができることを理論的に証明する。
偏見について,任意の偏見の正則化を解析し,偏見が正則化の異なる尺度で非常に異なる振る舞いをすることができることを示す。
論文 参考訳(メタデータ) (2024-06-05T12:03:27Z) - Higher-order topological kernels via quantum computation [68.8204255655161]
トポロジカルデータ分析(TDA)は、複雑なデータから意味のある洞察を抽出する強力なツールとして登場した。
本稿では,ベッチ曲線の次数増加に基づくBettiカーネルの量子的定義法を提案する。
論文 参考訳(メタデータ) (2023-07-14T14:48:52Z) - Support Recovery in Sparse PCA with Non-Random Missing Data [27.3669650952144]
非ランダムサンプリング方式の下で,不完全かつノイズの多いデータに基づいてスパースPCAの実用的なアルゴリズムを解析する。
理論的には、ある条件下では、スパースリード固有ベクトルの支持を高い確率で回復することができる。
提案アルゴリズムは, 観察された成分が良好な構造特性を持つ場合, その他のスパースPCA手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-02-03T04:20:25Z) - Contrastive Learning Can Find An Optimal Basis For Approximately
View-Invariant Functions [18.440569330385323]
本稿では,複数のコントラスト学習手法を,固定正対カーネルを近似した学習カーネル関数として再解釈できることを示す。
このカーネルとPCAを組み合わせることで得られる単純な表現は、線形予測器の最悪の近似誤差を確実に最小化する。
論文 参考訳(メタデータ) (2022-10-04T20:02:52Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Spectral learning of multivariate extremes [0.0]
多変量極度の依存構造を解析するためのスペクトルクラスタリングアルゴリズムを提案する。
本研究は,極端サンプルから構築したランダムな$k-アネレスト近傍グラフに基づくスペクトルクラスタリングの理論的性能について検討した。
角測度を学習するための簡易な一貫した推定手法を提案する。
論文 参考訳(メタデータ) (2021-11-15T14:33:06Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - Stochastic Approximation for Online Tensorial Independent Component
Analysis [98.34292831923335]
独立成分分析(ICA)は統計機械学習や信号処理において一般的な次元削減ツールである。
本稿では,各独立成分を推定する副産物オンライン時系列アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-28T18:52:37Z) - Upper and Lower Bounds on the Performance of Kernel PCA [15.745403317380282]
我々はカーネルpcaの効率について下界と上界に寄与する。
2つの境界は固定推定値であり、2つはPAC-ベイズ理論によるランダム化推定値である。
我々はカーネルPCAアルゴリズムの強みと限界を強調するために境界を散布します。
論文 参考訳(メタデータ) (2020-12-18T17:19:31Z) - Kernel Autocovariance Operators of Stationary Processes: Estimation and
Convergence [0.5505634045241288]
我々は、ヒルベルト空間を再現するカーネルに埋め込まれたポーランド空間上の定常過程の自己共分散作用素を考える。
これらの演算子の経験的推定が、様々な条件下でのプロセスの実現に沿ってどのように収束するかを考察する。
我々は、依存データを持つカーネルPCAの一貫性と遷移確率の条件平均埋め込みの観点から、我々の理論の応用について述べる。
論文 参考訳(メタデータ) (2020-04-02T09:17:32Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。