論文の概要: Estimating shared subspace with AJIVE: the power and limitation of multiple data matrices
- arxiv url: http://arxiv.org/abs/2501.09336v1
- Date: Thu, 16 Jan 2025 07:23:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-17 15:11:12.353794
- Title: Estimating shared subspace with AJIVE: the power and limitation of multiple data matrices
- Title(参考訳): AJIVEによる共有部分空間の推定:複数のデータ行列のパワーと制限
- Authors: Yuepeng Yang, Cong Ma,
- Abstract要約: 本稿では,マルチマトリックス設定における共有部分空間推定の体系的解析を行う。
2段階のスペクトルアプローチであるAJIVE法に焦点をあてた。
本研究では,高信号-雑音比(SNR)法では,行列数に応じてAJIVEの推定誤差が減少することを示す。
低SNR設定では、AJIVEは非縮小エラーを示し、基本的な制限を強調している。
- 参考スコア(独自算出の注目度): 22.32547146723177
- License:
- Abstract: Integrative data analysis often requires disentangling joint and individual variations across multiple datasets, a challenge commonly addressed by the Joint and Individual Variation Explained (JIVE) model. While numerous methods have been developed to estimate the shared subspace under JIVE, the theoretical understanding of their performance remains limited, particularly in the context of multiple matrices and varying levels of subspace misalignment. This paper bridges this gap by providing a systematic analysis of shared subspace estimation in multi-matrix settings. We focus on the Angle-based Joint and Individual Variation Explained (AJIVE) method, a two-stage spectral approach, and establish new performance guarantees that uncover its strengths and limitations. Specifically, we show that in high signal-to-noise ratio (SNR) regimes, AJIVE's estimation error decreases with the number of matrices, demonstrating the power of multi-matrix integration. Conversely, in low-SNR settings, AJIVE exhibits a non-diminishing error, highlighting fundamental limitations. To complement these results, we derive minimax lower bounds, showing that AJIVE achieves optimal rates in high-SNR regimes. Furthermore, we analyze an oracle-aided spectral estimator to demonstrate that the non-diminishing error in low-SNR scenarios is a fundamental barrier. Extensive numerical experiments corroborate our theoretical findings, providing insights into the interplay between SNR, matrix count, and subspace misalignment.
- Abstract(参考訳): 統合的データ分析は、複数のデータセットにまたがる関節と個々のバリエーションを必要とすることが多い。
JIVEの下で共有部分空間を推定するために多くの手法が開発されているが、その性能に関する理論的理解は、特に複数の行列と様々な部分空間の不整合の文脈において限られている。
本稿では,マルチマトリックス設定における共有部分空間推定の体系的解析を提供することにより,このギャップを埋める。
本稿では,アングルをベースとした2段階スペクトル手法であるジョイント・アンド・個人変動説明法(AJIVE)に着目し,その強度と限界を明らかにするための新たな性能保証を確立する。
具体的には、高信号-雑音比(SNR)レギュレーションにおいて、AJIVEの推定誤差は行列数とともに減少し、マルチ行列積分のパワーを示す。
逆に低SNR設定では、AJIVEは非最小化エラーを示し、基本的な制限を強調している。
これらの結果を補うために、AJIVEが高SNR方式で最適な速度を達成することを示すミニマックス下界を導出する。
さらに、オラクル支援スペクトル推定器を解析し、低SNRシナリオにおける非縮小誤差が基本的な障壁であることを示す。
大規模数値実験は、SNR、行列数、サブスペースの不整合の相互作用に関する洞察を与え、我々の理論的な知見を裏付けるものである。
関連論文リスト
- Optimal Estimation of Shared Singular Subspaces across Multiple Noisy Matrices [3.3373545585860596]
本研究は,低ランク行列デノジングフレームワークにおいて,複数の行列にまたがる共有(左)特異部分空間を推定することに焦点を当てる。
信号行列の真の特異部分空間が同一である場合、Stack-SVDは最小の最大速度最適化を実現する。
部分的共有の様々なケースにおいて、Stack-SVDが有効であり続ける条件を厳格に特徴付け、最小限の最適性を達成したり、一貫した見積もりを達成できなかったりする。
論文 参考訳(メタデータ) (2024-11-26T02:49:30Z) - Kernel spectral joint embeddings for high-dimensional noisy datasets using duo-landmark integral operators [9.782959684053631]
本研究では、2つの独立に観測された高次元ノイズデータセットの結合埋め込みを実現する新しいカーネルスペクトル法を提案する。
得られた低次元埋め込みは、同時クラスタリング、データの可視化、デノイングなど、多くの下流タスクに利用できる。
論文 参考訳(メタデータ) (2024-05-20T18:29:36Z) - Structured Matrix Learning under Arbitrary Entrywise Dependence and
Estimation of Markov Transition Kernel [4.360281374698232]
本稿では、ノイズの多い低ランク+スパース行列回復の一般的な枠組みについて考察する。
本稿では,不整合制約最小二乗推定器を提案し,その厳密性を決定論的下界とミニマックスリスクの整合性の両方で証明する。
次に、我々のフレームワークのいくつかの重要な統計機械学習問題への適用について紹介する。
論文 参考訳(メタデータ) (2024-01-04T20:13:23Z) - SOFARI: High-Dimensional Manifold-Based Inference [8.860162863559163]
我々は2つのSOFARI変種を導入し、強力で弱い潜伏要因を扱えるようにし、後者は広範囲のアプリケーションをカバーする。
そこで我々は,SOFARIが潜在左因子ベクトルと特異値の両方に対して偏差補正推定器を提供し,その平均零正規分布を疎分散で楽しむことを示す。
本稿では,SOFARIの有効性を概説し,シミュレーション例による理論結果の正当化と,経済予測における実データの適用について述べる。
論文 参考訳(メタデータ) (2023-09-26T16:01:54Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - Effective Data-aware Covariance Estimator from Compressed Data [63.16042585506435]
本研究では,データ対応重み付きサンプリングベース共分散行列推定器,すなわち DACE を提案し,非バイアス共分散行列推定を行う。
我々は、DACEの優れた性能を示すために、合成データセットと実世界のデータセットの両方で広範な実験を行う。
論文 参考訳(メタデータ) (2020-10-10T10:10:28Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z) - Multi-View Spectral Clustering Tailored Tensor Low-Rank Representation [105.33409035876691]
本稿では,テンソル低ランクモデルに基づくマルチビュースペクトルクラスタリング(MVSC)の問題について検討する。
MVSCに適合する新しい構造テンソル低ランクノルムを設計する。
提案手法は最先端の手法よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T11:52:12Z) - Information Directed Sampling for Linear Partial Monitoring [112.05623123909895]
線形報酬と観測構造を持つ部分的監視のための情報指向サンプリング(IDS)を導入する。
IDSは、ゲームの正確な可観測性条件に依存する適応的な最悪の後悔率を達成する。
結果がコンテキストおよびカーネル化設定にまで拡張され、アプリケーションの範囲が大幅に増加する。
論文 参考訳(メタデータ) (2020-02-25T21:30:56Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z) - Optimal Structured Principal Subspace Estimation: Metric Entropy and
Minimax Rates [6.00362077400694]
本稿では,一般構造主部分空間推定問題の統計的解析のための統一的な枠組みを提案する。
非負のPCA/SVD、スパースPCA/SVD、サブスペース制約PCA/SVD、スペクトルクラスタリングなどである。
一般的な結果を特定の設定に適用すると、それらの問題に対する収束の最小値が得られる。
論文 参考訳(メタデータ) (2020-02-18T15:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。