論文の概要: Gene Transformer: Transformers for the Gene Expression-based
Classification of Cancer Subtypes
- arxiv url: http://arxiv.org/abs/2108.11833v1
- Date: Thu, 26 Aug 2021 15:02:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 13:52:09.939028
- Title: Gene Transformer: Transformers for the Gene Expression-based
Classification of Cancer Subtypes
- Title(参考訳): 遺伝子トランスフォーマー:癌サブタイプの遺伝子発現に基づく分類のためのトランスフォーマー
- Authors: Anwar Khan and Boreom Lee
- Abstract要約: 本稿では,多頭部自己認識モジュールによる高次元遺伝子発現の複雑さに対処するエンド・ツー・エンドのディープラーニング手法であるGene Transformerを提案する。
Gene Transformerは、がんのサブタイプを分類するための効率的なアプローチであり、計算生物学におけるディープラーニングモデルの改善は、この領域でもよく反映できることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Adenocarcinoma and squamous cell carcinoma constitute approximately 40% and
30% of all lung cancer subtypes, respectively, and display broad heterogeneity
in terms of clinical and molecular responses to therapy. Molecular subtyping
has enabled precision medicine to overcome these challenges and provide
significant biological insights to predict prognosis and improve clinical
decision making. Over the past decade, conventional ML algorithms and DL-based
CNNs have been espoused for the classification of cancer subtypes from gene
expression datasets. However, these methods are potentially biased toward
identification of cancer biomarkers. Recently proposed transformer-based
architectures that leverage the self-attention mechanism encode high throughput
gene expressions and learn representations that are computationally complex and
parametrically expensive. However, compared to the datasets for natural
language processing applications, gene expression consists of several hundreds
of thousands of genes from a limited number of observations, making it
difficult to efficiently train transformers for bioinformatics applications.
Hence, we propose an end-to-end deep learning approach, Gene Transformer, which
addresses the complexity of high-dimensional gene expression with a multi-head
self-attention module by identifying relevant biomarkers across multiple cancer
subtypes without requiring feature selection as a prerequisite for the current
classification algorithms. The proposed architecture achieved an overall
improved performance for all evaluation metrics and had fewer misclassification
errors than the commonly used traditional classification algorithms. The
classification results show that Gene Transformer can be an efficient approach
for classifying cancer subtypes, indicating that any improvement in deep
learning models in computational biology can also be reflected well in this
domain.
- Abstract(参考訳): Adenocarcinoma と squamous cell carcinoma はそれぞれすべての肺癌亜型の約40%と30%を占め、治療に対する臨床的および分子的反応の点で幅広い異種性を示す。
分子サブタイピングは、これらの課題を克服し、予後を予測し、臨床意思決定を改善するための重要な生物学的洞察を提供する。
過去10年間で、従来のMLアルゴリズムとDLベースのCNNは、遺伝子発現データセットから癌サブタイプの分類に使われてきた。
しかし、これらの方法は癌バイオマーカーの同定に偏る可能性がある。
近年,自己着脱機構を利用したトランスフォーマーアーキテクチャが高スループットな遺伝子発現をエンコードし,計算量的に複雑でパラメトリックに高価な表現を学習する。
しかし、自然言語処理アプリケーション用のデータセットと比較して、遺伝子発現は限られた数の観察から数十万の遺伝子で構成されており、バイオインフォマティクス応用のためのトランスフォーマーを効率的に訓練することは困難である。
そこで本研究では,複数のがんサブタイプにまたがる関連バイオマーカーを同定することにより,多頭自己照準モジュールを用いた高次元遺伝子発現の複雑さに対処する,エンドツーエンドのディープラーニング手法であるgene transformerを提案する。
提案したアーキテクチャは,すべての評価指標に対して全体的な性能向上を実現し,従来の分類アルゴリズムよりも誤分類誤差が少なくなった。
分類の結果,遺伝子トランスフォーマーは癌サブタイプの分類に有効な手法であり,計算生物学における深層学習モデルの改善もこの領域でよく反映できることが示された。
関連論文リスト
- Precision Cancer Classification and Biomarker Identification from mRNA Gene Expression via Dimensionality Reduction and Explainable AI [0.9423257767158634]
本研究では,33種類の異なる癌とその対応する遺伝子群を正確に同定するための包括的パイプラインを提案する。
正規化と特徴選択技術を組み合わせて、データセットの次元性を効果的に削減する。
我々はExplainable AIを利用して、同定された癌特異的遺伝子の生物学的意義を解明する。
論文 参考訳(メタデータ) (2024-10-08T18:56:31Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Subtype-Former: a deep learning approach for cancer subtype discovery
with multi-omics data [17.36619699329539]
本研究では,TransformerとBlockに基づくディープラーニング手法であるSubtype-Formerを提案する。
その結果,Subtype-Formerは生存率分析に基づいて,5000以上の腫瘍のベンチマークデータセットで良好な性能を発揮することがわかった。
対象とするがん治療薬の研究に使用できる50種類の重要なバイオマーカーを同定した。
論文 参考訳(メタデータ) (2022-07-28T08:15:06Z) - Automated Cancer Subtyping via Vector Quantization Mutual Information
Maximization [10.191396978971168]
そこで本研究では,遺伝子プロファイルを利用してサブタイプを非教師付きで識別する新たなクラスタリング手法を提案する。
本手法は既存の論争を呼んだラベルを精製し,さらに医学的な分析により癌生存率と高い相関があることが証明された。
論文 参考訳(メタデータ) (2022-06-22T01:55:08Z) - Triplet Contrastive Learning for Brain Tumor Classification [99.07846518148494]
本稿では,脳腫瘍の深層埋め込みを直接学習する手法を提案する。
本手法は,27種類の腫瘍群からなる広範囲な脳腫瘍データセットを用いて評価し,そのうち13種は稀である。
論文 参考訳(メタデータ) (2021-08-08T11:26:34Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。