論文の概要: HeteroJIVE: Joint Subspace Estimation for Heterogeneous Multi-View Data
- arxiv url: http://arxiv.org/abs/2512.02866v1
- Date: Tue, 02 Dec 2025 15:28:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.945058
- Title: HeteroJIVE: Joint Subspace Estimation for Heterogeneous Multi-View Data
- Title(参考訳): HeteroJIVE:不均質なマルチビューデータの結合部分空間推定
- Authors: Jingyang Li, Zhongyuan Lyu,
- Abstract要約: 統計的不均一性を考慮した重み付き2段階スペクトルアルゴリズムHeteroJIVEを提案する。
本稿では,反復的な改善を必要とせずに,O(K-1/2)$レートをアルゴリズムが達成できることを実証する。
TCGA-BRCAマルチオミクスデータの適用により,HeteroJIVEの優位性が検証された。
- 参考スコア(独自算出の注目度): 7.187267927910277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many modern datasets consist of multiple related matrices measured on a common set of units, where the goal is to recover the shared low-dimensional subspace. While the Angle-based Joint and Individual Variation Explained (AJIVE) framework provides a solution, it relies on equal-weight aggregation, which can be strictly suboptimal when views exhibit significant statistical heterogeneity (arising from varying SNR and dimensions) and structural heterogeneity (arising from individual components). In this paper, we propose HeteroJIVE, a weighted two-stage spectral algorithm tailored to such heterogeneity. Theoretically, we first revisit the ``non-diminishing" error barrier with respect to the number of views $K$ identified in recent literature for the equal-weight case. We demonstrate that this barrier is not universal: under generic geometric conditions, the bias term vanishes and our estimator achieves the $O(K^{-1/2})$ rate without the need for iterative refinement. Extending this to the general-weight case, we establish error bounds that explicitly disentangle the two layers of heterogeneity. Based on this, we derive an oracle-optimal weighting scheme implemented via a data-driven procedure. Extensive simulations corroborate our theoretical findings, and an application to TCGA-BRCA multi-omics data validates the superiority of HeteroJIVE in practice.
- Abstract(参考訳): 現代のデータセットの多くは、共通の単位の集合で測定された複数の関連する行列で構成されており、そこでは共有された低次元部分空間を復元することが目的である。
AJIVE(Joint and Individual Variation Explained)フレームワークは解を提供するが、ビューが有意な統計的不均一性(SNRと次元の異なるもの)と構造的不均一性(個々の成分から生じるもの)を示す場合、厳密には準最適である等重集約に依存している。
本稿では,重み付き2段階スペクトルアルゴリズムであるHeteroJIVEを提案する。
理論的には、同重の場合の最近の文献で確認されている$K$のビュー数に関して、最初に ``non-diminishing' エラーバリアを再検討する。
この障壁は普遍的ではないことを示す: 一般的な幾何学的条件下でバイアス項は消滅し、我々の推定子は反復的洗練を必要とせずに$O(K^{-1/2})$レートを達成する。
これを一般重みに拡張すると、不均一性の2つの層を明示的に解離する誤差境界が成立する。
これに基づいて,データ駆動方式で実装したオラクル最適重み付け方式を導出する。
TCGA-BRCAマルチオミクスデータへの適用は,HeteroJIVEの実際上の優位性を検証している。
関連論文リスト
- Heteroscedastic Double Bayesian Elastic Net [1.1240642213359266]
平均分散と対数分散を共同でモデル化する新しいフレームワークであるヘテロセダスティックダブルベイズ弾性ネット(HDBEN)を提案する。
本手法は, 回帰係数と分散パラメータの分散とグループ化を同時に引き起こし, データの複雑な分散構造を捉える。
論文 参考訳(メタデータ) (2025-02-04T05:44:19Z) - Estimating shared subspace with AJIVE: the power and limitation of multiple data matrices [22.32547146723177]
本稿では,マルチマトリックス設定における共有部分空間推定の体系的解析を行う。
2段階のスペクトルアプローチであるAJIVE法に焦点をあてた。
本研究では,高信号-雑音比(SNR)法では,行列数に応じてAJIVEの推定誤差が減少することを示す。
低SNR設定では、AJIVEは非縮小エラーを示し、基本的な制限を強調している。
論文 参考訳(メタデータ) (2025-01-16T07:23:26Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.342834401139078]
本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文 参考訳(メタデータ) (2023-09-14T15:58:30Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。