論文の概要: Gene-MOE: A Sparsely-gated Framework for Pan-Cancer Genomic Analysis
- arxiv url: http://arxiv.org/abs/2311.17401v2
- Date: Fri, 15 Dec 2023 03:19:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 18:22:49.890655
- Title: Gene-MOE: A Sparsely-gated Framework for Pan-Cancer Genomic Analysis
- Title(参考訳): Gene-MOE: パンカウンサーゲノム解析のためのスパースゲートフレームワーク
- Authors: Xiangyu Meng, Xue Li, Qing Yang, Huanhuan Dai, Lian Qiao, Hongzhen
Ding, Long Hao and Xun Wang
- Abstract要約: そこで本研究では, RNA-seq解析フレームワークであるGene-MOEについて紹介する。
Gene-MOEは、分析精度を高めるために、MOE層とアテンションエキスパート層の混合物のポテンシャルを利用する。
事前訓練を通じて33種類のがんからパンがん情報を統合することで、過度に適合する課題に対処する。
- 参考スコア(独自算出の注目度): 13.57379781623848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benefiting from the advancements in deep learning, various genomic analytical
techniques, such as survival analysis, classification of tumors and their
subtypes, and exploration of specific pathways, have significantly enhanced our
understanding of the biological mechanisms driving cancer. However, the
overfitting issue, arising from the limited number of patient samples, poses a
challenge in improving the accuracy of genome analysis by deepening the neural
network. Furthermore, it remains uncertain whether novel approaches such as the
sparsely gated mixture of expert (MOE) and self-attention mechanisms can
improve the accuracy of genomic analysis. In this paper, we introduce a novel
sparsely gated RNA-seq analysis framework called Gene-MOE. This framework
exploits the potential of the MOE layers and the proposed mixture of attention
expert (MOAE) layers to enhance the analysis accuracy. Additionally, it
addresses overfitting challenges by integrating pan-cancer information from 33
distinct cancer types through pre-training.We pre-trained Gene-MOE on TCGA
pan-cancer RNA-seq dataset with 33 cancer types. Subsequently, we conducted
experiments involving cancer classification and survival analysis based on the
pre-trained Gene-MOE. According to the survival analysis results on 14 cancer
types, Gene-MOE outperformed state-of-the-art models on 12 cancer types.
Through detailed feature analysis, we found that the Gene-MOE model could learn
rich feature representations of high-dimensional genes. According to the
classification results, the total accuracy of the classification model for 33
cancer classifications reached 95.8%, representing the best performance
compared to state-of-the-art models. These results indicate that Gene-MOE holds
strong potential for use in cancer classification and survival analysis.
- Abstract(参考訳): 深層学習の進歩の恩恵を受け、生存分析、腫瘍とそのサブタイプの分類、特定の経路の探索など様々なゲノム解析技術は、がんを駆動する生物学的メカニズムの理解を大きく高めています。
しかし、患者サンプルの数が限られていることから生じる過剰適合問題は、ニューラルネットワークの深化によってゲノム解析の精度を向上させる上で課題となる。
さらに,sparsely gated mixture of expert (moe) やself-attention mechanism などの新しい手法がゲノム解析の精度を向上させるかは,まだ不明である。
本稿では,Gene-MOEと呼ばれるRNA-seq解析フレームワークについて紹介する。
このフレームワークは、moe層と提案する注意エキスパート(moae)層の混合を利用して分析精度を向上させる。
さらに,TGAパン・カンサーRNA-seqデータセットに,33種類のがん情報を事前訓練することで,過剰適合する課題に対処した。
その後,事前訓練した遺伝子MOEに基づく癌分類と生存分析に関する実験を行った。
14種類のがんの生存率分析の結果、遺伝子モエは12種類のがんの最先端モデルよりも優れていた。
詳細な特徴分析により,遺伝子MOEモデルは高次元遺伝子のリッチな特徴表現を学習できることがわかった。
分類結果によると,33のがん分類の分類モデルの総精度は95.8%に達し,最先端モデルと比較して最高の成績を示した。
これらの結果から,遺伝子MOEは癌分類と生存分析に有用であることが示唆された。
関連論文リスト
- Precision Cancer Classification and Biomarker Identification from mRNA Gene Expression via Dimensionality Reduction and Explainable AI [0.9423257767158634]
本研究では,33種類の異なる癌とその対応する遺伝子群を正確に同定するための包括的パイプラインを提案する。
正規化と特徴選択技術を組み合わせて、データセットの次元性を効果的に削減する。
我々はExplainable AIを利用して、同定された癌特異的遺伝子の生物学的意義を解明する。
論文 参考訳(メタデータ) (2024-10-08T18:56:31Z) - Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.869831177092736]
腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文 参考訳(メタデータ) (2024-08-13T23:24:36Z) - Self-Normalizing Foundation Model for Enhanced Multi-Omics Data Analysis in Oncology [0.0]
SeNMoは、33のがんタイプにわたるマルチオミクスデータに基づいてトレーニングされた基礎モデルである。
当科では,33のがん部位を含む膵癌マルチオミクスデータを用いて,SeNMoの全身生存を訓練した。
SeNMoはMoffitt Cancer CenterとCPTAC肺扁平上皮癌という2つの独立したコホートで検証された。
論文 参考訳(メタデータ) (2024-05-13T22:45:44Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Pan-Cancer Integrative Histology-Genomic Analysis via Interpretable
Multimodal Deep Learning [4.764927152701701]
14種類のがん患者5,720人のスライド画像,RNA配列,コピー数の変化,および突然変異データを統合する。
我々の解釈可能な、弱教師付き、マルチモーダルなディープラーニングアルゴリズムは、これらの不均一なモダリティを融合して結果を予測することができる。
本研究は,全ての癌型にまたがる予後予測に寄与する形態学的および分子マーカーを解析する。
論文 参考訳(メタデータ) (2021-08-04T20:40:05Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。