論文の概要: DEDUCE: Multi-head attention decoupled contrastive learning to discover cancer subtypes based on multi-omics data
- arxiv url: http://arxiv.org/abs/2307.04075v3
- Date: Sat, 26 Oct 2024 07:43:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:16:58.312727
- Title: DEDUCE: Multi-head attention decoupled contrastive learning to discover cancer subtypes based on multi-omics data
- Title(参考訳): DEDUCE:マルチオミクスデータに基づくがんサブタイプ発見のためのコントラスト学習
- Authors: Liangrui Pan, Xiang Wang, Qingchun Liang, Jiandong Shang, Wenjuan Liu, Liwen Xu, Shaoliang Peng,
- Abstract要約: マルチオミクスのがんデータを解析するための教師なしコントラスト学習のためのモデルDDUCEを提案する。
このモデルは教師なしのSMAEを採用し、マルチオミクスデータからコンテキストの特徴や長距離依存を深く抽出することができる。
サブタイプは、マルチオミクスデータの特徴空間とサンプル空間の両方におけるサンプル間の類似性を計算することでクラスタ化される。
- 参考スコア(独自算出の注目度): 7.049723871585993
- License:
- Abstract: Background and Objective: Given the high heterogeneity and clinical diversity of cancer, substantial variations exist in multi-omics data and clinical features across different cancer subtypes. Methods: We propose a model, named DEDUCE, based on a symmetric multi-head attention encoders (SMAE), for unsupervised contrastive learning to analyze multi-omics cancer data, with the aim of identifying and characterizing cancer subtypes. This model adopts a unsupervised SMAE that can deeply extract contextual features and long-range dependencies from multi-omics data, thereby mitigating the impact of noise. Importantly, DEDUCE introduces a subtype decoupled contrastive learning method based on a multi-head attention mechanism to simultaneously learn features from multi-omics data and perform clustering for identifying cancer subtypes. Subtypes are clustered by calculating the similarity between samples in both the feature space and sample space of multi-omics data. The fundamental concept involves decoupling various attributes of multi-omics data features and learning them as contrasting terms. A contrastive loss function is constructed to quantify the disparity between positive and negative examples, and the model minimizes this difference, thereby promoting the acquisition of enhanced feature representation. Results: The DEDUCE model undergoes extensive experiments on simulated multi-omics datasets, single-cell multi-omics datasets, and cancer multi-omics datasets, outperforming 10 deep learning models. The DEDUCE model outperforms state-of-the-art methods, and ablation experiments demonstrate the effectiveness of each module in the DEDUCE model. Finally, we applied the DEDUCE model to identify six cancer subtypes of AML.
- Abstract(参考訳): 背景と目的: がんの多様性と多様性が高いことを考えると、マルチオミクスデータや様々ながんサブタイプにまたがる臨床特徴にかなりの差異がある。
方法: がんのサブタイプを特定し特徴付けることを目的とした, 教師なしコントラスト学習のための, 対称型マルチヘッドアテンションエンコーダ(SMAE)に基づくDDUCEモデルを提案する。
このモデルは教師なしのSMAEを採用し、マルチオミクスデータから文脈的特徴や長距離依存を深く抽出し、ノイズの影響を軽減する。
重要なことに、DDUCEはマルチヘッドアテンション機構に基づくサブタイプ分離型コントラスト学習手法を導入し、マルチオミクスデータから特徴を同時に学習し、がんサブタイプを特定するクラスタリングを行う。
サブタイプは、マルチオミクスデータの特徴空間とサンプル空間の両方におけるサンプルの類似性を計算することでクラスタ化される。
基本的な概念は、マルチオミクスのデータ特徴の様々な属性を分離し、対照的な用語として学習することである。
正例と負例の差分を定量化するために、対照的な損失関数を構築し、この差分を最小化し、拡張された特徴表現の獲得を促進する。
結果: DEDUCEモデルはシミュレーションされたマルチオミクスデータセット,シングルセルマルチオミクスデータセット,がんマルチオミクスデータセットに関する広範な実験を行い,10のディープラーニングモデルを上回った。
DEDUCEモデルは最先端の手法より優れており、DDUCEモデルにおける各モジュールの有効性を示すアブレーション実験である。
最後にDDUCEモデルを用いて,AMLの癌サブタイプを6つ同定した。
関連論文リスト
- Multi-omics data integration for early diagnosis of hepatocellular carcinoma (HCC) using machine learning [8.700808005009806]
異なるモードのマルチクラスデータの遅延統合が可能なアンサンブル機械学習アルゴリズムの性能を比較した。
PB-MVBoostとAdaboostとソフト投票という2つの強化された方法が、全体的な最高のパフォーマンスモデルであった。
論文 参考訳(メタデータ) (2024-09-20T09:38:02Z) - PACS: Prediction and analysis of cancer subtypes from multi-omics data
based on a multi-head attention mechanism model [2.275409158519155]
がんサブタイプの分類を成功させるために, 教師付きマルチヘッドアテンション機構モデル(SMA)を提案する。
SMAモデルのアテンション機構と特徴共有モジュールは、マルチオミクスデータのグローバルおよびローカルの特徴情報をうまく学習することができる。
SMAモデルは、シミュレーションされた単一細胞およびがんマルチオミクスデータセットにおけるがんサブタイプの最も正確なF1マクロスコープ、F1重み付きおよび正確な分類を達成する。
論文 参考訳(メタデータ) (2023-08-21T03:54:21Z) - MoCLIM: Towards Accurate Cancer Subtyping via Multi-Omics Contrastive
Learning with Omics-Inference Modeling [9.900594964709116]
我々は癌サブタイプのための表現学習フレームワークであるMoCLIMを開発した。
その結果,本手法は,高次元癌症例の少ない症例において,データ適合性やサブタイプ性能を著しく向上させることが示唆された。
本フレームワークは, 各種医療評価を最終要素として含み, 医療分析における高い解釈可能性を提供する。
論文 参考訳(メタデータ) (2023-08-17T10:49:48Z) - Cancer Subtyping by Improved Transcriptomic Features Using Vector
Quantized Variational Autoencoder [10.835673227875615]
本稿では,Vector Quantized Variational AutoEncoder (VQ-VAE)を提案する。
VQ-VAEは厳密な仮定を課さないため、その潜在機能は入力のより良い表現であり、メインストリームのクラスタリング手法で優れたクラスタリング性能を得ることができる。
論文 参考訳(メタデータ) (2022-07-20T09:47:53Z) - SubOmiEmbed: Self-supervised Representation Learning of Multi-omics Data
for Cancer Type Classification [4.992154875028543]
マルチオミクスデータの統合と解析により腫瘍の広い視野が得られ,臨床診断の精度が向上する。
SubOmiEmbedは、非常に小さなネットワークを持つベースラインであるOmiEmbedに匹敵する結果を生成する。
この作業は、突然変異に基づくゲノムデータを統合するために改善される。
論文 参考訳(メタデータ) (2022-02-03T16:39:09Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。