論文の概要: Scale-Calibrated Median-of-Means for Robust Distributed Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2605.20681v1
- Date: Wed, 20 May 2026 03:48:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.470975
- Title: Scale-Calibrated Median-of-Means for Robust Distributed Principal Component Analysis
- Title(参考訳): ロバスト分散主成分分析のためのスケールキャリブレーション媒体
- Authors: Kisung You,
- Abstract要約: 分散主成分分析のためのスケールキャリブレーション中央値推定器について検討した。
ノードレベルのPCA展開は、平均成分が通常の線形影響を持つことを示しているが、サブスペース成分は固有ギャップ空間摂動である。
本研究では,ロバストなブロックスケールと最適キャリブレーションルールを提案し,高確率な平均値境界を確立し,要因的に悪いノードの影響を特徴づけ,ノードブートストラップの有効性を証明した。
- 参考スコア(独自算出の注目度): 0.31727619150610836
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Distributed principal component analysis (PCA) produces node-level estimates of both a mean vector and a principal subspace. Robustly aggregating these heterogeneous objects requires a relative scale between mean error and subspace error. We study a scale-calibrated median-of-means estimator for this problem using the product geometry of Euclidean space and the Grassmann manifold. A node-level PCA expansion shows that the mean component has the usual linear influence, whereas the subspace component is an eigengap-weighted covariance perturbation. We prove a local reduction showing that the proposed product-manifold median-of-means estimator is asymptotically equivalent to a scaled spatial median of node influence errors. This yields fixed-node non-Gaussian limits, growing-node Gaussian limits with finite-block bias, and an explicit scale-dependent covariance formula. We propose robust block-scale and inference-optimal calibration rules, establish high-probability median-of-means bounds, characterize factorwise bad-node influence, and prove node-bootstrap validity. Simulations and large-scale single-cell RNA-seq data show that scale calibration adapts to eigengap-driven subspace uncertainty and provides a robust distributed PCA summary.
- Abstract(参考訳): 分散主成分分析(PCA)は、平均ベクトルと主部分空間の両方のノードレベル推定を生成する。
これらの不均一なオブジェクトをロバストに集約するには、平均誤差と部分空間誤差の間の相対スケールが必要である。
我々は、ユークリッド空間とグラスマン多様体の積幾何学を用いて、この問題に対するスケールキャリブレーション中央値推定器について検討する。
ノードレベルPCA展開は平均成分が通常の線形影響を持つことを示しているが、部分空間成分は固有ギャップ重み付き共分散摂動である。
提案手法は,ノード影響誤差の空間的中央値と漸近的に等価であることを示す。
これにより、固定ノード非ガウス極限、有限ブロックバイアスを持つ成長ノードガウス極限、および明示的なスケール依存共分散式が得られる。
本研究では,ロバストなブロックスケールと最適キャリブレーションルールを提案し,高確率な平均値境界を確立し,要因的に悪いノードの影響を特徴づけ,ノードブートストラップの有効性を証明した。
シミュレーションと大規模単一セルRNA-seqデータにより、スケールキャリブレーションは固有ギャップ駆動のサブスペースの不確実性に適応し、ロバストな分散PCAサマリを提供する。
関連論文リスト
- SEED: Targeted Data Selection by Weighted Independent Set [76.68391670109433]
我々はSEEDと呼ばれる堅牢でスケーラブルなデータ選択パイプラインを開発した。
SEEDは、命令チューニング、視覚的命令チューニング、セマンティックセグメンテーションにおける最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-05-15T07:26:54Z) - Intrinsic effective sample size for manifold-valued Markov chain Monte Carlo via kernel discrepancy [0.31727619150610836]
カーネルの差分に基づく効率的なサンプルサイズを提案する。
提案した量は、実験的な分布と対象の分布との間には、同じ2乗のカーネルの差が生じる独立したドローの数である。
論文 参考訳(メタデータ) (2026-05-05T01:37:41Z) - Curvature-Aware PCA with Geodesic Tangent Space Aggregation for Semi-Supervised Learning [52.452902154360565]
GTSA-PCAは主成分分析の幾何学的拡張である。
曲率認識と測地的整合性を統合されたスペクトルフレームワークに統合する。
以上の結果から,GTSA-PCAは次元減少に対する統計的および幾何学的アプローチの原則的ブリッジとして位置づけられた。
論文 参考訳(メタデータ) (2026-04-20T20:36:36Z) - Heavy-Tailed Principle Component Analysis [0.8866338330056278]
我々は、$mathbfX = A1/2mathbfG$という形の超統計依存モデルに基づいて生成された高次元データのPCAについて検討する。
対数損失の下でPCAを定式化し、モーメントが存在しない場合でも適切に定義する。
本研究の主理論的結果は,この損失下での重尾観測の主成分は,標準PCAを用いて得られたものと一致していることを示している。
論文 参考訳(メタデータ) (2026-03-11T21:07:04Z) - Stability and Generalization of Push-Sum Based Decentralized Optimization over Directed Graphs [55.77845440440496]
プッシュベースの分散通信は、情報交換が非対称である可能性のある通信ネットワークの最適化を可能にする。
我々は、グラディエント・プッシュ(SGP)アルゴリズムのための統一的な一様安定性フレームワークを開発する。
重要な技術的要素は、2つの量に束縛された不均衡認識の一般化である。
論文 参考訳(メタデータ) (2026-02-24T05:32:03Z) - Robust Tangent Space Estimation via Laplacian Eigenvector Gradient Orthogonalization [48.25304391127552]
データ多様体の接空間を推定することは、データ解析の基本的な問題である。
局所接空間推定を導くために,データのグローバル構造を利用したラプラシアン固有ベクトル勾配直交化法(LEGO)を提案する。
論文 参考訳(メタデータ) (2025-10-02T17:59:45Z) - Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.342834401139078]
本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文 参考訳(メタデータ) (2023-09-14T15:58:30Z) - Robust Estimation for Nonparametric Families via Generative Adversarial
Networks [92.64483100338724]
我々は,高次元ロバストな統計問題を解くためにGAN(Generative Adversarial Networks)を設計するためのフレームワークを提供する。
我々の研究は、これらをロバスト平均推定、第二モーメント推定、ロバスト線形回帰に拡張する。
技術面では、提案したGAN損失は、スムーズで一般化されたコルモゴロフ-スミルノフ距離と見なすことができる。
論文 参考訳(メタデータ) (2022-02-02T20:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。