論文の概要: OmiEmbed: reconstruct comprehensive phenotypic information from
multi-omics data using multi-task deep learning
- arxiv url: http://arxiv.org/abs/2102.02669v1
- Date: Wed, 3 Feb 2021 07:34:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-05 16:00:32.510096
- Title: OmiEmbed: reconstruct comprehensive phenotypic information from
multi-omics data using multi-task deep learning
- Title(参考訳): OmiEmbed:マルチタスク深層学習を用いたマルチオミクスデータからの包括的表現型情報再構成
- Authors: Xiaoyu Zhang, Kai Sun, Yike Guo
- Abstract要約: 高次元オミクスデータは、パーソナライズド医療に不可欠な本質的なバイオメディカル情報を含む。
多数の分子的特徴と少量のサンプルのために、ゲノム全体のデータからそれらを捉えることは困難である。
我々は,高次元オミクスデータから表現型の全体的かつ比較的正確なプロファイルを捉えるために,OmiEmbedという統合マルチタスク深層学習フレームワークを提案した。
- 参考スコア(独自算出の注目度): 19.889861433855053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional omics data contains intrinsic biomedical information that is
crucial for personalised medicine. Nevertheless, it is challenging to capture
them from the genome-wide data due to the large number of molecular features
and small number of available samples, which is also called "the curse of
dimensionality" in machine learning. To tackle this problem and pave the way
for machine learning aided precision medicine, we proposed a unified multi-task
deep learning framework called OmiEmbed to capture a holistic and relatively
precise profile of phenotype from high-dimensional omics data. The deep
embedding module of OmiEmbed learnt an omics embedding that mapped multiple
omics data types into a latent space with lower dimensionality. Based on the
new representation of multi-omics data, different downstream networks of
OmiEmbed were trained together with the multi-task strategy to predict the
comprehensive phenotype profile of each sample. We trained the model on two
publicly available omics datasets to evaluate the performance of OmiEmbed. The
OmiEmbed model achieved promising results for multiple downstream tasks
including dimensionality reduction, tumour type classification, multi-omics
integration, demographic and clinical feature reconstruction, and survival
prediction. Instead of training and applying different downstream networks
separately, the multi-task strategy combined them together and conducted
multiple tasks simultaneously and efficiently. The model achieved better
performance with the multi-task strategy comparing to training them
individually. OmiEmbed is a powerful tool to accurately capture comprehensive
phenotypic information from high-dimensional omics data and has a great
potential to facilitate more accurate and personalised clinical decision
making.
- Abstract(参考訳): 高次元オミスデータは、個人化医療に不可欠な内在的な生体医学情報を含んでいる。
それにもかかわらず、機械学習の「次元の呪い」とも呼ばれる多数の分子機能と少数の利用可能なサンプルのために、ゲノム全体のデータからそれらをキャプチャすることは困難です。
そこで我々は,この問題に対処し,機械学習による精密医療を支援するために,OmiEmbedと呼ばれるマルチタスク深層学習フレームワークを提案し,高次元オミクスデータから表現型の全体的かつ比較的正確なプロファイルを抽出した。
omiembed の深い埋め込みモジュールは、複数の omics データ型を低次元の潜在空間にマッピングした omics 埋め込みを学習した。
マルチオミクスデータの新たな表現に基づいて,各サンプルの包括的表現型プロファイルを予測するためのマルチタスク戦略とともに,オメムベッドの異なる下流ネットワークを訓練した。
そこで我々は,OmiEmbedの性能を評価するために,2つの公開オミクスデータセットを用いてモデルを訓練した。
OmiEmbed モデルは, 次元減少, 腫瘍型分類, マルチオミクス統合, 人口統計学的, 臨床的特徴再構成, 生存予測など, 複数の下流課題に対して有望な結果を得た。
異なるダウンストリームネットワークを個別にトレーニングして適用する代わりに、マルチタスク戦略はそれらを組み合わせることで、同時に効率的に複数のタスクを実行した。
このモデルは、個々のトレーニングと比較してマルチタスク戦略でより良いパフォーマンスを達成しました。
OmiEmbedは、高次元オミクスデータから包括的表現型情報を正確に取得する強力なツールであり、より正確でパーソナライズされた臨床意思決定を促進する大きな可能性を秘めている。
関連論文リスト
- MAMMAL -- Molecular Aligned Multi-Modal Architecture and Language [0.24434823694833652]
MAMMALは、大規模生物学的データセットから学習する多目的マルチタスク基盤モデルである。
我々は、幅広い分類、回帰、生成タスクをサポートするプロンプト構文を導入する。
典型的薬物発見パイプライン内の異なるステップにまたがる11種類の下流タスクのモデルを評価した。
論文 参考訳(メタデータ) (2024-10-28T20:45:52Z) - A Multitask Deep Learning Model for Classification and Regression of Hyperspectral Images: Application to the large-scale dataset [44.94304541427113]
ハイパースペクトル画像上で複数の分類タスクと回帰タスクを同時に行うマルチタスク深層学習モデルを提案する。
我々は、TAIGAと呼ばれる大規模なハイパースペクトルデータセットに対するアプローチを検証した。
結果の総合的定性的および定量的分析により,提案手法が他の最先端手法よりも有意に優れていることを示す。
論文 参考訳(メタデータ) (2024-07-23T11:14:54Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - CustOmics: A versatile deep-learning based strategy for multi-omics
integration [0.0]
本稿では,高次元マルチソース統合の場合のデータセットに適応する,カスタマイズ可能なオートエンコーダモデルを構築するための新しい戦略を提案する。
我々は,統合戦略が潜在表現に与える影響を評価し,新しい手法であるCustOmicsを提案する最善の戦略を組み合わせる。
論文 参考訳(メタデータ) (2022-09-12T14:20:29Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - SubOmiEmbed: Self-supervised Representation Learning of Multi-omics Data
for Cancer Type Classification [4.992154875028543]
マルチオミクスデータの統合と解析により腫瘍の広い視野が得られ,臨床診断の精度が向上する。
SubOmiEmbedは、非常に小さなネットワークを持つベースラインであるOmiEmbedに匹敵する結果を生成する。
この作業は、突然変異に基づくゲノムデータを統合するために改善される。
論文 参考訳(メタデータ) (2022-02-03T16:39:09Z) - Multi-task Semi-supervised Learning for Pulmonary Lobe Segmentation [2.8016091833446617]
肺葉のセグメンテーションは肺疾患の解析における重要な前処理課題である。
ディープラーニングベースのメソッドは、これらの従来のアプローチを上回ります。
深層マルチタスク学習は、複数の異なる構造のラベルを活用することが期待される。
論文 参考訳(メタデータ) (2021-04-22T12:33:30Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。