論文の概要: Multi-View Variational Autoencoder for Missing Value Imputation in
Untargeted Metabolomics
- arxiv url: http://arxiv.org/abs/2310.07990v2
- Date: Tue, 12 Mar 2024 15:34:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 01:35:25.594646
- Title: Multi-View Variational Autoencoder for Missing Value Imputation in
Untargeted Metabolomics
- Title(参考訳): 非標的メタボロミクスにおける値インプテーションを欠くマルチビュー変分オートエンコーダ
- Authors: Chen Zhao, Kuan-Jui Su, Chong Wu, Xuewei Cao, Qiuying Sha, Wu Li, Zhe
Luo, Tian Qin, Chuan Qiu, Lan Juan Zhao, Anqi Liu, Lindong Jiang, Xiao Zhang,
Hui Shen, Weihua Zhou, Hong-Wen Deng
- Abstract要約: 本稿では,WGSデータと参照代謝産物の情報を利用して未知の代謝産物をインプットする新しい手法を提案する。
両オミクスデータの潜伏表現を学習することにより,欠落したメタボロミクス値を効果的にインプットすることができる。
- 参考スコア(独自算出の注目度): 17.563099908890013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Missing data is a common challenge in mass spectrometry-based
metabolomics, which can lead to biased and incomplete analyses. The integration
of whole-genome sequencing (WGS) data with metabolomics data has emerged as a
promising approach to enhance the accuracy of data imputation in metabolomics
studies. Method: In this study, we propose a novel method that leverages the
information from WGS data and reference metabolites to impute unknown
metabolites. Our approach utilizes a multi-view variational autoencoder to
jointly model the burden score, polygenetic risk score (PGS), and linkage
disequilibrium (LD) pruned single nucleotide polymorphisms (SNPs) for feature
extraction and missing metabolomics data imputation. By learning the latent
representations of both omics data, our method can effectively impute missing
metabolomics values based on genomic information. Results: We evaluate the
performance of our method on empirical metabolomics datasets with missing
values and demonstrate its superiority compared to conventional imputation
techniques. Using 35 template metabolites derived burden scores, PGS and
LD-pruned SNPs, the proposed methods achieved R^2-scores > 0.01 for 71.55% of
metabolites. Conclusion: The integration of WGS data in metabolomics imputation
not only improves data completeness but also enhances downstream analyses,
paving the way for more comprehensive and accurate investigations of metabolic
pathways and disease associations. Our findings offer valuable insights into
the potential benefits of utilizing WGS data for metabolomics data imputation
and underscore the importance of leveraging multi-modal data integration in
precision medicine research.
- Abstract(参考訳): 背景: データの欠落は質量分析に基づくメタボロミクスの一般的な課題であり、偏りや不完全な分析につながる可能性がある。
wgs(whole-genome sequencing)データとメタボロミクスデータの統合は、メタボロミクス研究におけるデータのインプテーションの正確性を高めるための有望なアプローチとして現れてきた。
方法: 本研究は, WGSデータと参照代謝産物の情報を利用して未知の代謝産物を注入する新しい手法を提案する。
提案手法では,多視点変動型オートエンコーダを用いて重み付けスコア,ポリジェネティックリスクスコア(PGS),リンケージ不平衡単一ヌクレオチド多型(SNP)を共同でモデル化し,特徴抽出とメタボロミクスデータ計算の欠如について検討した。
両方のオミクスデータの潜在表現を学習することにより、ゲノム情報に基づくメタボロミクス値の欠落を効果的に誘発することができる。
結果: 経験的メタボロミクスデータセットの性能評価を行い, 従来の計算法と比較して, その優位性を実証した。
テンプレートメタボライト35種, PGS, LD-pruned SNPsを用いて, R^2-scores > 0.01を代謝物の71.55%に対して達成した。
結論: メタボロミクス計算におけるWGSデータの統合は, データの完全性の向上だけでなく, 下流の分析も促進し, 代謝経路や疾患関連に関するより包括的かつ正確な研究の道を開く。
本研究は,WGSデータを用いたメタボロミクスデータ計算における有用性についての知見を提供し,精度医学研究におけるマルチモーダルデータ統合の意義を浮き彫りにした。
関連論文リスト
- Gene-Metabolite Association Prediction with Interactive Knowledge Transfer Enhanced Graph for Metabolite Production [49.814615043389864]
メタボリックグラフに基づく遺伝子メタボリック・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション
2474の代謝産物と1947年の2つの一般的な微生物の遺伝子を含む最初のベンチマークを提示する。
提案手法は,各種リンク予測フレームワークのベースラインを最大12.3%向上させる。
論文 参考訳(メタデータ) (2024-10-24T06:54:27Z) - Meta-Learning on Augmented Gene Expression Profiles for Enhanced Lung Cancer Detection [3.7929238927240685]
本稿では,遺伝子発現プロファイルから肺がんを予測するためのメタラーニングに基づくアプローチを提案する。
メタ学習タスクには4つの異なるデータセットを使用します。
その結果、単一のデータセットでトレーニングされたベースラインと比較して、強化されたソースデータに対するメタラーニングの優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-19T01:39:12Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Integrate Any Omics: Towards genome-wide data integration for patient
stratification [6.893309898200498]
IntegrAOは、不完全なマルチオミクスデータを統合し、新しいサンプルを分類するための教師なしのフレームワークである。
不均一データや不完全データを扱うIntegratedAOの能力は、精度オンコロジーに不可欠なツールである。
論文 参考訳(メタデータ) (2024-01-15T19:57:07Z) - Optimal transport for automatic alignment of untargeted metabolomic data [8.692678207022084]
本稿では,LC-MSデータセットを最適なトランスポートで自動的に組み合わせる,フレキシブルでユーザフレンドリなアルゴリズムであるGromovMatcherを紹介する。
特徴強度相関構造を利用することで、GromovMatcherは優れたアライメント精度とロバスト性を提供する。
我々は,GromovMatcherが,いくつかのがんタイプに関連するライフスタイルのリスク要因に関連するバイオマーカーの検索をいかに促進するかを示す。
論文 参考訳(メタデータ) (2023-06-05T20:08:19Z) - Functional Integrative Bayesian Analysis of High-dimensional
Multiplatform Genomic Data [0.8029049649310213]
我々は高次元多プラットフォームゲノミクスデータ(fiBAG)の関数積分ベイズ解析というフレームワークを提案する。
fiBAGは、プロテオゲノムバイオマーカーの上流での機能的証拠の同時同定を可能にする。
本研究は,14種類のがんのパン・カンサー解析を用いて,fiBAGの収益性を示す。
論文 参考訳(メタデータ) (2022-12-29T03:31:45Z) - RandomSCM: interpretable ensembles of sparse classifiers tailored for
omics data [59.4141628321618]
決定規則の結合や解離に基づくアンサンブル学習アルゴリズムを提案する。
モデルの解釈可能性により、高次元データのバイオマーカー発見やパターン発見に有用である。
論文 参考訳(メタデータ) (2022-08-11T13:55:04Z) - A robust kernel machine regression towards biomarker selection in
multi-omics datasets of osteoporosis for drug discovery [2.2897244874280043]
本稿では,ロバスト・カーネル・マシン・レグレッション(RobMR)を提案する。
実験により, 提案手法は骨粗しょう症の関連因子を効果的に同定することを示した。
提案手法は、利用可能なあらゆる疾患モデルマルチオミクスデータセットに適用できる。
論文 参考訳(メタデータ) (2022-01-13T16:39:46Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。