論文の概要: Gene-MOE: A Sparsely-gated Framework for Pan-Cancer Genomic Analysis
- arxiv url: http://arxiv.org/abs/2311.17401v1
- Date: Wed, 29 Nov 2023 07:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 22:15:59.928443
- Title: Gene-MOE: A Sparsely-gated Framework for Pan-Cancer Genomic Analysis
- Title(参考訳): Gene-MOE: パンカウンサーゲノム解析のためのスパースゲートフレームワーク
- Authors: Xiangyu Meng, Tao Song, Qing Yang, Huanhuan Dai, Lian Qiao, Hongzhen
Ding, Long Hao and Xun Wang
- Abstract要約: そこで我々は、Pan-Cancerデータセットの一般的な特徴表現を学習するために、Gene-MOEと呼ばれる新しい事前学習モデルを提案する。
Gene-MOEは、エキスパート層の混合物をフル活用して、高次元遺伝子のリッチな特徴表現を学習する。
Gene-MOEを用いた癌分類と生存分析実験を行った。
- 参考スコア(独自算出の注目度): 13.983823410471784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Analyzing the genomic information from the Pan-Cancer database can help us
understand cancer-related factors and contribute to the cancer diagnosis and
prognosis. However, existing computational methods and deep learning methods
can not effectively find the deep correlations between tens of thousands of
genes, which leads to precision loss. In this paper, we proposed a novel
pretrained model called Gene-MOE to learn the general feature representations
of the Pan-Cancer dataset and transfer the pretrained weights to the downstream
tasks. The Gene-MOE fully exploits the mixture of expert (MOE) layers to learn
rich feature representations of high-dimensional genes. At the same time, we
build a mixture of attention expert (MOAE) model to learn the deep semantic
relationships within genetic features. Finally, we proposed a new
self-supervised pretraining strategy including loss function design, data
enhancement, and optimization strategy to train the Gene-MOE and further
improve the performance for the downstream analysis. We carried out cancer
classification and survival analysis experiments based on the Gene-MOE.
According to the survival analysis results on 14 cancer types, using Gene-MOE
outperformed state-of-the-art models on 12 cancer types. According to the
classification results, the total accuracy of the classification model for 33
cancer classifications reached 95.2\%. Through detailed feature analysis, we
found the Gene-MOE model can learn rich feature representations of
high-dimensional genes.
- Abstract(参考訳): Pan-Cancerデータベースからゲノム情報を解析することで、がん関連因子を理解し、がんの診断と予後に寄与することができる。
しかし、既存の計算方法や深層学習法は、数万の遺伝子間の深い相関を効果的に見つけることができないため、精度が低下する。
本稿では,pan-cancerデータセットの一般的な特徴表現を学習し,その重みを下流タスクに伝達するために,gene-moeと呼ばれる新しい事前学習モデルを提案する。
Gene-MOEは、専門家層(MOE)の混合をフル活用して、高次元遺伝子のリッチな特徴表現を学習する。
同時に、遺伝的特徴の深い意味関係を学習するために、注意専門家(MOAE)の混合モデルを構築した。
最後に、損失関数設計、データ拡張、最適化戦略を含む新たな自己教師型事前学習戦略を提案し、Gene-MOEを訓練し、下流解析の性能をさらに向上させた。
Gene-MOEを用いた癌分類と生存分析実験を行った。
14種類のがんの生存率分析結果によると、遺伝子モエを用いた12種類の癌に対する最先端のモデルを用いた。
分類結果によると,33のがん分類の分類モデルの総精度は95.2\%に達した。
詳細な特徴分析により、高次元遺伝子のリッチな特徴表現を学習できる遺伝子MOEモデルが発見された。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Precision Cancer Classification and Biomarker Identification from mRNA Gene Expression via Dimensionality Reduction and Explainable AI [0.9423257767158634]
本研究では,33種類の異なる癌とその対応する遺伝子群を正確に同定するための包括的パイプラインを提案する。
正規化と特徴選択技術を組み合わせて、データセットの次元性を効果的に削減する。
我々はExplainable AIを利用して、同定された癌特異的遺伝子の生物学的意義を解明する。
論文 参考訳(メタデータ) (2024-10-08T18:56:31Z) - Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.869831177092736]
腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文 参考訳(メタデータ) (2024-08-13T23:24:36Z) - Self-Normalizing Foundation Model for Enhanced Multi-Omics Data Analysis in Oncology [0.0]
SeNMoは、33のがんタイプにわたるマルチオミクスデータに基づいてトレーニングされた基礎モデルである。
当科では,33のがん部位を含む膵癌マルチオミクスデータを用いて,SeNMoの全身生存を訓練した。
SeNMoはMoffitt Cancer CenterとCPTAC肺扁平上皮癌という2つの独立したコホートで検証された。
論文 参考訳(メタデータ) (2024-05-13T22:45:44Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Pan-Cancer Integrative Histology-Genomic Analysis via Interpretable
Multimodal Deep Learning [4.764927152701701]
14種類のがん患者5,720人のスライド画像,RNA配列,コピー数の変化,および突然変異データを統合する。
我々の解釈可能な、弱教師付き、マルチモーダルなディープラーニングアルゴリズムは、これらの不均一なモダリティを融合して結果を予測することができる。
本研究は,全ての癌型にまたがる予後予測に寄与する形態学的および分子マーカーを解析する。
論文 参考訳(メタデータ) (2021-08-04T20:40:05Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。