論文の概要: Inference for Heteroskedastic PCA with Missing Data
- arxiv url: http://arxiv.org/abs/2107.12365v1
- Date: Mon, 26 Jul 2021 17:59:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-27 16:13:17.512141
- Title: Inference for Heteroskedastic PCA with Missing Data
- Title(参考訳): 欠測データを用いたヘテロスケダスティックPCAの推論
- Authors: Yuling Yan, Yuxin Chen, Jianqing Fan
- Abstract要約: 本稿では,主成分分析(PCA)のための信頼性バニラ領域を高速に構築する方法を示す。
両推定器の非漸近分布保証を開発し,これらを両信頼領域の計算に利用する方法を実証する。
- 参考スコア(独自算出の注目度): 11.866563658370739
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies how to construct confidence regions for principal
component analysis (PCA) in high dimension, a problem that has been vastly
under-explored. While computing measures of uncertainty for nonlinear/nonconvex
estimators is in general difficult in high dimension, the challenge is further
compounded by the prevalent presence of missing data and heteroskedastic noise.
We propose a suite of solutions to perform valid inference on the principal
subspace based on two estimators: a vanilla SVD-based approach, and a more
refined iterative scheme called $\textsf{HeteroPCA}$ (Zhang et al., 2018). We
develop non-asymptotic distributional guarantees for both estimators, and
demonstrate how these can be invoked to compute both confidence regions for the
principal subspace and entrywise confidence intervals for the spiked covariance
matrix. Particularly worth highlighting is the inference procedure built on top
of $\textsf{HeteroPCA}$, which is not only valid but also statistically
efficient for broader scenarios (e.g., it covers a wider range of missing rates
and signal-to-noise ratios). Our solutions are fully data-driven and adaptive
to heteroskedastic random noise, without requiring prior knowledge about the
noise levels and noise distributions.
- Abstract(参考訳): 本稿では,主成分分析(PCA)のための信頼性領域を高次元で構築する方法について述べる。
非線形・非凸推定器の不確かさの計算は一般に高次元では難しいが、この課題は欠落データやヘテロスケダスティックノイズの存在によってさらに複雑になる。
バニラSVDに基づくアプローチと、より洗練された反復スキームである $\textsf{HeteroPCA}$ (Zhang et al., 2018) を用いて、主部分空間上の妥当な推論を行うための一組のソリューションを提案する。
両推定器の非漸近分布保証を開発し、これらが主部分空間の信頼領域とスパイクされた共分散行列の入射信頼区間の両方を計算するためにどのように呼び出されるかを示す。
特に注目に値するのは、$\textsf{HeteroPCA}$の上に構築された推論手順である。
我々のソリューションは完全にデータ駆動であり、ノイズレベルやノイズ分布に関する事前知識を必要とせず、ヘテロスケダティックランダムノイズに適応する。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
提案手法は,予測された直接効果推定値,隠された仲介者,共同設立者,モデレーターまで拡張する。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Variational DAG Estimation via State Augmentation With Stochastic Permutations [16.57658783816741]
ベイズネットワークの構造を観測データから推定することは統計的かつ計算的に難しい問題である。
確率的推論の観点から、主な課題は(i) DAG 制約を満たすグラフ上の分布を表すこと、(ii) 基礎空間上の後方を推定することである。
そこで本稿では,DAGと置換の強化空間上に共同分布を定式化することにより,これらの課題に対処するアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-04T23:51:04Z) - Efficient Conformal Prediction under Data Heterogeneity [79.35418041861327]
コンフォーマル予測(CP)は不確実性定量化のための頑健な枠組みである。
非交換性に対処するための既存のアプローチは、最も単純な例を超えて計算不可能なメソッドにつながる。
この研究は、比較的一般的な非交換可能なデータ分布に対して証明可能な信頼セットを生成する、CPに新しい効率的なアプローチを導入する。
論文 参考訳(メタデータ) (2023-12-25T20:02:51Z) - On the Estimation Performance of Generalized Power Method for
Heteroscedastic Probabilistic PCA [21.9585534723895]
我々は,少なくとも幾何的にあるしきい値に束縛されたGPM間の適切な繰り返しを仮定すると,GPMは,ある「相対分解」の残余部分であるしきい値に減少することを示す。
そこで本研究では,PCA手法を用いて,ガウス以下の雑音設定による優れた性能を示す。
論文 参考訳(メタデータ) (2023-12-06T11:41:17Z) - Learning Linear Causal Representations from Interventions under General
Nonlinear Mixing [52.66151568785088]
介入対象にアクセスできることなく、未知の単一ノード介入を考慮し、強い識別可能性を示す。
これは、ディープニューラルネットワークの埋め込みに対する非ペアの介入による因果識別性の最初の例である。
論文 参考訳(メタデータ) (2023-06-04T02:32:12Z) - Optimizing the Noise in Self-Supervised Learning: from Importance
Sampling to Noise-Contrastive Estimation [80.07065346699005]
GAN(Generative Adversarial Networks)のように、最適な雑音分布はデータ分布に等しくなると広く想定されている。
我々は、この自己教師型タスクをエネルギーベースモデルの推定問題として基礎づけるノイズ・コントラスト推定に目を向ける。
本研究は, 最適雑音のサンプリングは困難であり, 効率性の向上は, データに匹敵する雑音分布を選択することに比べ, 緩やかに行うことができると結論付けた。
論文 参考訳(メタデータ) (2023-01-23T19:57:58Z) - Non-Linear Spectral Dimensionality Reduction Under Uncertainty [107.01839211235583]
我々は、不確実性情報を活用し、いくつかの従来のアプローチを直接拡張する、NGEUと呼ばれる新しい次元削減フレームワークを提案する。
提案したNGEUの定式化は,大域的な閉形式解を示し,Radecherの複雑性に基づいて,基礎となる不確実性がフレームワークの一般化能力に理論的にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2022-02-09T19:01:33Z) - On the Role of Entropy-based Loss for Learning Causal Structures with
Continuous Optimization [27.613220411996025]
因果構造学習問題を最小二乗損失を用いた連続最適化問題として定式化する。
ガウス雑音の仮定に違反すると因果方向の同定が妨げられることを示す。
より一般的なエントロピーに基づく損失は、任意の雑音分布下での確率スコアと理論的に一致している。
論文 参考訳(メタデータ) (2021-06-05T08:29:51Z) - Robust Bayesian Inference for Discrete Outcomes with the Total Variation
Distance [5.139874302398955]
離散的に評価された結果のモデルは、データがゼロインフレーション、過分散または汚染を示す場合、容易に誤特定される。
ここでは、Ttal Variation Distance (TVD) を用いた頑健な相違に基づくベイズ的アプローチを提案する。
我々は、我々のアプローチが堅牢で、シミュレーションおよび実世界のデータの範囲で予測性能を著しく改善していることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-26T09:53:06Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。