論文の概要: Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics
- arxiv url: http://arxiv.org/abs/2111.13987v1
- Date: Sat, 27 Nov 2021 21:18:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 19:05:04.942857
- Title: Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics
- Title(参考訳): 標準相関解析法による多モード融合 : 病理組織学およびゲノム学による乳癌生存予測への応用
- Authors: Vaishnavi Subramanian, Tanveer Syeda-Mahmood, and Minh N. Do
- Abstract要約: 2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 16.537929113715432
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The availability of multi-modality datasets provides a unique opportunity to
characterize the same object of interest using multiple viewpoints more
comprehensively. In this work, we investigate the use of canonical correlation
analysis (CCA) and penalized variants of CCA (pCCA) for the fusion of two
modalities. We study a simple graphical model for the generation of
two-modality data. We analytically show that, with known model parameters,
posterior mean estimators that jointly use both modalities outperform arbitrary
linear mixing of single modality posterior estimators in latent variable
prediction. Penalized extensions of CCA (pCCA) that incorporate domain
knowledge can discover correlations with high-dimensional, low-sample data,
whereas traditional CCA is inapplicable. To facilitate the generation of
multi-dimensional embeddings with pCCA, we propose two matrix deflation schemes
that enforce desirable properties exhibited by CCA. We propose a two-stage
prediction pipeline using pCCA embeddings generated with deflation for latent
variable prediction by combining all the above. On simulated data, our proposed
model drastically reduces the mean-squared error in latent variable prediction.
When applied to publicly available histopathology data and RNA-sequencing data
from The Cancer Genome Atlas (TCGA) breast cancer patients, our model can
outperform principal components analysis (PCA) embeddings of the same dimension
in survival prediction.
- Abstract(参考訳): マルチモダリティデータセットの可用性は、より包括的に複数の視点を用いて、同じ関心対象を特徴付けるユニークな機会を提供する。
本研究では, 2つのモードの融合にカノニカル相関解析(CCA)と, CCAの変種(pCCA)を併用することを検討した。
2モードデータ生成のための簡単なグラフィカルモデルについて検討する。
モデルパラメータが既知の場合,両様相を共用する後方平均推定器が,潜在変数予測において単一様相後方推定器の任意の線形混合よりも優れていることを解析的に示す。
ドメイン知識を組み込んだCCA(pCCA)のペナル化拡張は、高次元の低サンプルデータとの相関を発見できるが、従来のCCAは適用できない。
pCCAによる多次元埋め込みの創出を容易にするため,CCAが提示する望ましい特性を強制する2つの行列デフレ方式を提案する。
本稿では,これらすべてを組み合わせ,デフレで生成されたpCCA埋め込みを用いた2段階予測パイプラインを提案する。
シミュレーションデータでは,提案モデルが潜在変数予測における平均二乗誤差を大幅に低減する。
The Cancer Genome Atlas (TCGA) 乳癌患者の病理組織データとRNAシークエンシングデータに適用すると、生存予測において同じ次元の主成分分析(PCA)埋め込みよりも優れている。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - A Bayesian Methodology for Estimation for Sparse Canonical Correlation [0.0]
標準相関解析(CCA)は、データセット間の関係を識別する統計手法である。
ScSCCAは、異なるデータモダリティ間の相互関係の堅牢なモデリングを目的とした、急速に発展する方法論分野である。
ベイズ無限因子モデルを用いて,ロバストな推定を実現する新しいSCSCCA手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T15:14:25Z) - Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery [1.057079240576682]
離散状態発見問題に対する教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案する。
GLDAは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借りている。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
論文 参考訳(メタデータ) (2022-06-28T18:33:46Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Lung Cancer Risk Estimation with Incomplete Data: A Joint Missing
Imputation Perspective [5.64530854079352]
マルチモーダルデータの連成分布をモデル化することで、欠落データの計算に対処する。
本稿では, PBiGAN を用いた新しい条件付き PBiGAN (C-PBiGAN) 法を提案する。
C-PBiGANは, 肺がんのリスク評価において, 代表的計算法と比較して有意に改善した。
論文 参考訳(メタデータ) (2021-07-25T20:15:16Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Probabilistic Canonical Correlation Analysis for Sparse Count Data [3.1753001245931323]
正準相関解析は2つの連続変数間の関係を探索する重要な手法である。
2つのスパースカウントデータセットの相関と正準相関推定のためのモデルに基づく確率的アプローチを提案する。
論文 参考訳(メタデータ) (2020-05-11T02:19:57Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。