論文の概要: Scalable Randomized Kernel Methods for Multiview Data Integration and
Prediction
- arxiv url: http://arxiv.org/abs/2304.04692v1
- Date: Mon, 10 Apr 2023 16:14:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 14:23:33.796807
- Title: Scalable Randomized Kernel Methods for Multiview Data Integration and
Prediction
- Title(参考訳): マルチビューデータ統合と予測のためのスケーラブルランダム化カーネル法
- Authors: Sandra E. Safo and Han Lu
- Abstract要約: 複数のソースからのデータを協調的に関連づけるスケーラブルなランダム化カーネル手法を開発し、同時に結果を予測するか、ユニットを2つ以上のクラスに分類する。
提案手法は,多視点データにおける非線形関係を,臨床結果の予測とともにモデル化し,ビュー間の関係に最も寄与する変数や変数群を同定する。
- 参考スコア(独自算出の注目度): 4.801208484529834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop scalable randomized kernel methods for jointly associating data
from multiple sources and simultaneously predicting an outcome or classifying a
unit into one of two or more classes. The proposed methods model nonlinear
relationships in multiview data together with predicting a clinical outcome and
are capable of identifying variables or groups of variables that best
contribute to the relationships among the views. We use the idea that random
Fourier bases can approximate shift-invariant kernel functions to construct
nonlinear mappings of each view and we use these mappings and the outcome
variable to learn view-independent low-dimensional representations. Through
simulation studies, we show that the proposed methods outperform several other
linear and nonlinear methods for multiview data integration. When the proposed
methods were applied to gene expression, metabolomics, proteomics, and
lipidomics data pertaining to COVID-19, we identified several molecular
signatures forCOVID-19 status and severity. Results from our real data
application and simulations with small sample sizes suggest that the proposed
methods may be useful for small sample size problems. Availability: Our
algorithms are implemented in Pytorch and interfaced in R and would be made
available at: https://github.com/lasandrall/RandMVLearn.
- Abstract(参考訳): 複数のソースからのデータを協調的に関連づけるスケーラブルなランダム化カーネル手法を開発し、同時に結果を予測するか、ユニットを2つ以上のクラスに分類する。
提案手法は,多視点データにおける非線形関係を,臨床結果の予測とともにモデル化し,ビュー間の関係に最も寄与する変数や変数群を同定する。
ランダムなフーリエ基底はシフト不変カーネル関数を近似して各ビューの非線形写像を構成することができ、これらの写像と結果変数を用いてビュー非依存の低次元表現を学習する。
シミュレーション研究により,提案手法は,他の線形・非線形手法よりも多視点データ統合に優れることを示した。
提案手法がcovid-19関連遺伝子発現,メタボロミクス,プロテオミクス,および脂質代謝データに適用されたとき,いくつかの分子シグネチャがcovid-19状態と重症度を示すことが判明した。
実データアプリケーションおよびサンプルサイズが小さいシミュレーションの結果から,提案手法がサンプルサイズ問題に有用である可能性が示唆された。
可用性: 私たちのアルゴリズムはPytorchで実装され、Rでインターフェースされています。
関連論文リスト
- Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Heterogeneous Multi-Task Gaussian Cox Processes [61.67344039414193]
異種相関タスクを共同でモデル化するためのマルチタスクガウスコックスプロセスの新たな拡張を提案する。
MOGPは、分類、回帰、ポイントプロセスタスクの専用可能性のパラメータに先行して、異種タスク間の情報の共有を容易にする。
モデルパラメータを推定するための閉形式反復更新を実現する平均場近似を導出する。
論文 参考訳(メタデータ) (2023-08-29T15:01:01Z) - A Graphical Model for Fusing Diverse Microbiome Data [2.385985842958366]
本稿では,このような数値データを共同でモデル化するフレキシブルな多項ガウス生成モデルを提案する。
本稿では、潜在変数とモデルのパラメータを推定するための、計算にスケーラブルな変動予測-最大化(EM)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-21T17:54:39Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - MoReL: Multi-omics Relational Learning [26.484803417186384]
ヘテロジニアスビューの分子間相互作用をコードする多部グラフを効率的に推定する新しいディープベイズ生成モデルを提案する。
このようなディープベイズ生成モデルにおける最適輸送正則化により、ビュー固有側情報を組み込むだけでなく、分布ベース正則化によるモデルの柔軟性も向上する。
論文 参考訳(メタデータ) (2022-03-15T02:50:07Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Multi-view Data Visualisation via Manifold Learning [0.03222802562733786]
本論文は, 学生のT分散SNE, LLE, ISOMAPの拡張を提案し, 多視点データの次元的縮小と可視化を可能にする。
マルチビューマニホールド学習手法で得られた低次元埋め込みをK平均アルゴリズムに組み込むことにより、サンプルのクラスタを正確に特定できることを示した。
論文 参考訳(メタデータ) (2021-01-17T19:54:36Z) - Deep Representational Similarity Learning for analyzing neural
signatures in task-based fMRI dataset [81.02949933048332]
本稿では、表現類似度分析(RSA)の深部拡張であるDRSL(Deep Representational similarity Learning)を開発する。
DRSLは、多数の被験者を持つfMRIデータセットにおける様々な認知タスク間の類似性を分析するのに適している。
論文 参考訳(メタデータ) (2020-09-28T18:30:14Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。