論文の概要: Mean-Shift PCA by Knockoff Mean
- arxiv url: http://arxiv.org/abs/2605.25460v1
- Date: Mon, 25 May 2026 06:10:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.34163
- Title: Mean-Shift PCA by Knockoff Mean
- Title(参考訳): ノックオフ平均による平均シフトPCA
- Authors: Mengda Li, Zeng Li, Jianfeng Yao,
- Abstract要約: 平均シフトノイズ成分をPCAから除去する方法を示す。
標準PCAは試料平均のシフトに非常に敏感である。
平均シフト成分を識別・除去する平均を追加することで,2段階PCAアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 1.867072656545946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Removing noise is difficult, but adding noise is easy. In this work, we show how to eliminate mean-shift noisy components from PCA by deliberately introducing knockoff mean-shift perturbation. Standard PCA is highly sensitive to shifts in the sample mean: a small fraction of samples from a shifted distribution can cause large deviations in the leading principal components. In high-dimensional regimes, existing Robust PCA approaches cannot handle the mean-shift contamination structure inherent in the mixture model. Using tools from Random Matrix Theory, we prove that the mean-shift spikes are spectrally separable from the stable eigenvalues of the original covariance. Furthermore, the original eigenspace remains asymptotically invariant to the contamination, independent of the mixture weight. Exploiting this spectral stability, we propose a simple, two-stage PCA algorithm by adding knockoff mean that identifies and removes the mean-shift component using only standard PCA operations.
- Abstract(参考訳): ノイズの除去は難しいが、ノイズの追加は容易である。
そこで本研究では,PCAから平均シフト雑音成分を除去するために,故意に平均シフト摂動を導入する方法を示す。
標準PCAはサンプル平均のシフトに非常に敏感であり、シフトした分布からのサンプルのごく一部は主成分に大きなずれを引き起こす可能性がある。
高次元レシエーションでは、既存のロバストPCAアプローチは混合モデルに固有の平均シフト汚染構造を扱えない。
ランダム行列理論のツールを用いて、平均シフトスパイクが元の共分散の安定固有値とスペクトル的に分離可能であることを示す。
さらに、元の固有空間は混合重量とは独立に、汚染に漸近的に不変である。
そこで本研究では,従来のPCA操作のみを用いて,平均シフト成分を識別・除去するノックオフ平均を追加することで,このスペクトル安定性を実現するための2段階PCAアルゴリズムを提案する。
関連論文リスト
- Scale-Calibrated Median-of-Means for Robust Distributed Principal Component Analysis [0.31727619150610836]
分散主成分分析のためのスケールキャリブレーション中央値推定器について検討した。
ノードレベルのPCA展開は、平均成分が通常の線形影響を持つことを示しているが、サブスペース成分は固有ギャップ空間摂動である。
本研究では,ロバストなブロックスケールと最適キャリブレーションルールを提案し,高確率な平均値境界を確立し,要因的に悪いノードの影響を特徴づけ,ノードブートストラップの有効性を証明した。
論文 参考訳(メタデータ) (2026-05-20T03:48:31Z) - Measuring and Decomposing Mode Separation via the Canonical Diffusion [0.0]
モード分離は密度の基本的な幾何学的性質であり、高次元での定量化が難しい。
密度に固有の1つのプロセスを通してモード分離を測定する。
i)合成ガウス混合物,(ii)SDXLテキスト・トゥ・イメージ世代,(ii)SSAとDAがエントロピーとPCAミスを捉えた構造,(iii)アラニンジペプチドの分子動力学,(iii)DAは静的サンプルから既知の遅いバックボーンを回収する。
論文 参考訳(メタデータ) (2026-05-09T08:05:55Z) - Heavy-Tailed Principle Component Analysis [0.8866338330056278]
我々は、$mathbfX = A1/2mathbfG$という形の超統計依存モデルに基づいて生成された高次元データのPCAについて検討する。
対数損失の下でPCAを定式化し、モーメントが存在しない場合でも適切に定義する。
本研究の主理論的結果は,この損失下での重尾観測の主成分は,標準PCAを用いて得られたものと一致していることを示している。
論文 参考訳(メタデータ) (2026-03-11T21:07:04Z) - The Malignant Tail: Spectral Segregation of Label Noise in Over-Parameterized Networks [0.0]
ネットワークが機能的に信号とノイズを分離する障害モードであるMorignant Tailを実験的に分離する。
トレーニングされていないネットワークは、ノイズを積極的に分離し、ノイズに支配されたサブスペースを外科的にプルークするポストホックスペクトルトラニケーションを実現する。
以上の結果から,ラベルノイズ下では,余剰スペクトル容量は無害な冗長性ではなく,構造的負債が潜んでいることが示唆された。
論文 参考訳(メタデータ) (2026-03-02T16:39:42Z) - Stability and Generalization of Push-Sum Based Decentralized Optimization over Directed Graphs [55.77845440440496]
プッシュベースの分散通信は、情報交換が非対称である可能性のある通信ネットワークの最適化を可能にする。
我々は、グラディエント・プッシュ(SGP)アルゴリズムのための統一的な一様安定性フレームワークを開発する。
重要な技術的要素は、2つの量に束縛された不均衡認識の一般化である。
論文 参考訳(メタデータ) (2026-02-24T05:32:03Z) - PCA++: How Uniformity Induces Robustness to Background Noise in Contrastive Learning [12.061533430519702]
高次元データは、しばしば構造化背景雑音によって隠蔽される低次元信号を含む。
対照的な学習によって動機づけられた我々は、正のペアから共有信号部分空間を復元する問題、同じ信号を共有するが、バックグラウンドで異なるペアの観測に対処する。
我々のベースラインであるPCA+は、アライメントのみのコントラスト学習を使用し、背景変動が穏やかな場合に成功するが、強いノイズや高次元の条件下では失敗する。
我々は,PCA++を紹介した。PCA++は制約の厳しいコントラスト型PCAで,投影された特徴に対して同一性共分散を強制する。
論文 参考訳(メタデータ) (2025-11-15T16:11:39Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Enhanced Principal Component Analysis under A Collaborative-Robust
Framework [89.28334359066258]
重み学習とロバストな損失を非自明な方法で組み合わせる,一般的な協調ロバスト重み学習フレームワークを提案する。
提案されたフレームワークでは、トレーニング中の重要度を示す適切なサンプルの一部のみがアクティブになり、エラーが大きい他のサンプルは無視されません。
特に、不活性化試料の負の効果はロバスト損失関数によって軽減される。
論文 参考訳(メタデータ) (2021-03-22T15:17:37Z) - Suppressing Mislabeled Data via Grouping and Self-Attention [60.14212694011875]
ディープネットワークは大規模クリーンなデータに対して優れた結果を得るが、ノイズのあるラベルから学習すると著しく劣化する。
本稿では,概念的にシンプルだが効率的な学習ブロックを提案し,これをAFM(Attentive Feature Mixup)と呼ぶ。
クリーンなサンプルにもっと注意を払うことができ、小さなグループでのサンプルインタラクションを通じて、ラベルを間違えることが少なくなります。
論文 参考訳(メタデータ) (2020-10-29T13:54:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。