論文の概要: Cellwise and Casewise Robust Covariance in High Dimensions
- arxiv url: http://arxiv.org/abs/2505.19925v1
- Date: Mon, 26 May 2025 12:46:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.435045
- Title: Cellwise and Casewise Robust Covariance in High Dimensions
- Title(参考訳): 高次元におけるセルワイズおよびケースワイズロバスト共分散
- Authors: Fabio Centofanti, Mia Hubert, Peter J. Rousseeuw,
- Abstract要約: cellRCovメソッドは、ケースワイド・アウトレイア、セルワイド・アウトレイア、および欠落したデータを同時に処理する。
シミュレーション研究は、汚染されたデータシナリオと欠落したデータシナリオにおいて、CellRCovの優れた性能を示す。
また、ロバストかつ規則化された正準相関解析のためのセルRCCA法の構築と説明を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The sample covariance matrix is a cornerstone of multivariate statistics, but it is highly sensitive to outliers. These can be casewise outliers, such as cases belonging to a different population, or cellwise outliers, which are deviating cells (entries) of the data matrix. Recently some robust covariance estimators have been developed that can handle both types of outliers, but their computation is only feasible up to at most 20 dimensions. To remedy this we propose the cellRCov method, a robust covariance estimator that simultaneously handles casewise outliers, cellwise outliers, and missing data. It relies on a decomposition of the covariance on principal and orthogonal subspaces, leveraging recent work on robust PCA. It also employs a ridge-type regularization to stabilize the estimated covariance matrix. We establish some theoretical properties of cellRCov, including its casewise and cellwise influence functions as well as consistency and asymptotic normality. A simulation study demonstrates the superior performance of cellRCov in contaminated and missing data scenarios. Furthermore, its practical utility is illustrated in a real-world application to anomaly detection. We also construct and illustrate the cellRCCA method for robust and regularized canonical correlation analysis.
- Abstract(参考訳): サンプル共分散行列は多変量統計学の基盤であるが、外れ値に非常に敏感である。
これらは、異なる集団に属している場合や、データマトリックスの細胞(エントリ)を逸脱しているセルワイズアウトレイアのようなケースワイズアウトレイアである。
近年,2種類の外乱を扱える頑健な共分散推定器が開発されているが,その計算は少なくとも20次元までしか実現できない。
そこで本稿では, ケースワイド・アウトリー, セルワイド・アウトリー, データの欠落を同時に処理するロバストな共分散推定器である cellRCov 法を提案する。
これは、主部分空間と直交部分空間の共分散の分解に依存し、ロバストPCAに関する最近の研究を活用している。
また、推定共分散行列を安定化するためにリッジ型正規化を用いる。
我々はセルラクトフのいくつかの理論的性質を確立し、そのケースワイドおよびセルワイド影響関数、一貫性と漸近正規性を含む。
シミュレーション研究は、汚染されたデータシナリオと欠落したデータシナリオにおいて、CellRCovの優れた性能を示す。
さらに,その実用性は,実世界の異常検出への応用に説明されている。
また、ロバストかつ規則化された正準相関解析のためのセルRCCA法の構築と説明を行う。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.342834401139078]
本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文 参考訳(メタデータ) (2023-09-14T15:58:30Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - The Cellwise Minimum Covariance Determinant Estimator [1.90365714903665]
そこで本研究では,MCD方式のセルワイド・ロバストなバージョンであるCellMCDを提案する。
セルワイド・アウトリーのシミュレーションでは良好に動作し、クリーンなデータに対する有限サンプル効率が高い。
実際のデータと結果の視覚化で示される。
論文 参考訳(メタデータ) (2022-07-27T12:33:51Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - A Robust Test for Elliptical Symmetry [2.030567625639093]
楕円性GoFテストは通常分析が困難であり、統計力は特に強くないことが多い。
デ・フィネッティが導入した交換可能な確率変数計算に基づく新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-05T08:51:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。