論文の概要: Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review
- arxiv url: http://arxiv.org/abs/2301.12222v1
- Date: Sat, 28 Jan 2023 15:03:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 18:19:15.210596
- Title: Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review
- Title(参考訳): 遺伝子発現データを用いた癌分類のための機械学習手法の検討
- Authors: Fadi Alharbi and Aleksandar Vakanski
- Abstract要約: がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cancer is a term that denotes a group of diseases caused by abnormal growth
of cells that can spread in different parts of the body. According to the World
Health Organization (WHO), cancer is the second major cause of death after
cardiovascular diseases. Gene expression can play a fundamental role in the
early detection of cancer, as it is indicative of the biochemical processes in
tissue and cells, as well as the genetic characteristics of an organism.
Deoxyribonucleic Acid (DNA) microarrays and Ribonucleic Acid (RNA)- sequencing
methods for gene expression data allow quantifying the expression levels of
genes and produce valuable data for computational analysis. This study reviews
recent progress in gene expression analysis for cancer classification using
machine learning methods. Both conventional and deep learning-based approaches
are reviewed, with an emphasis on the ap-plication of deep learning models due
to their comparative advantages for identifying gene patterns that are
distinctive for various types of cancers. Relevant works that employ the most
commonly used deep neural network architectures are covered, including
multi-layer perceptrons, convolutional, recurrent, graph, and transformer
networks. This survey also presents an overview of the data collection methods
for gene expression analysis and lists important datasets that are commonly
used for supervised machine learning for this task. Furthermore, reviewed are
pertinent techniques for feature engineering and data preprocessing that are
typically used to handle the high dimensionality of gene expression data,
caused by a large number of genes present in data samples. The paper concludes
with a discussion of future research directions for machine learning-based gene
expression analysis for cancer classification.
- Abstract(参考訳): がん(がん、英: cancer)は、細胞の異常な増殖によって引き起こされる疾患群を指す用語である。
世界保健機関(who)によると、心臓血管疾患の2番目に大きな死因は癌である。
遺伝子発現は、組織や細胞の生化学的過程や生物の遺伝的特性を示すため、癌の早期発見において基本的な役割を果たす。
deoxyribonucleic acid (dna) microarrays and ribonucleic acid (rna)-sequencing method for gene expression dataにより、遺伝子の発現レベルを定量化し、計算分析に有用なデータを生成する。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
従来型と深層型の両方のアプローチを概観し, 各種癌に特有の遺伝子パターンを同定する上での利点として, 深層学習モデルのap-plicationに着目した。
最も一般的に使用されるディープニューラルネットワークアーキテクチャを使用する関連作業は、多層パーセプトロン、畳み込み、再帰、グラフ、トランスフォーマーネットワークなどをカバーする。
本調査では、遺伝子発現解析のためのデータ収集手法の概要と、このタスクの教師あり機械学習によく使用される重要なデータセットをリストアップする。
さらに、データサンプルに存在する多数の遺伝子によって引き起こされる遺伝子発現データの高次元性を扱うために一般的に使用される、機能工学とデータ前処理のための関連する技術がレビューされている。
本稿では,癌分類のための機械学習に基づく遺伝子発現解析の今後の研究方向性について論じる。
関連論文リスト
- Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.869831177092736]
腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文 参考訳(メタデータ) (2024-08-13T23:24:36Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - A Comparative Analysis of Gene Expression Profiling by Statistical and
Machine Learning Approaches [1.8954222800767324]
がん検体を分類する機械学習モデルの生物学的および方法論的限界について論じる。
遺伝子ランキングはこれらのモデルに適応した説明可能性法から得られる。
ブラックボックスニューラルネットワークによって学習された情報は、微分表現の概念と関連している。
論文 参考訳(メタデータ) (2024-02-01T18:17:36Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - An end-to-end framework for gene expression classification by
integrating a background knowledge graph: application to cancer prognosis
prediction [1.5484595752241122]
我々は、一次データの分類モデルを構築するために、二次データを扱うエンドツーエンドフレームワークを提案した。
我々はこの枠組みを,遺伝子発現データと生物学的ネットワークを用いた癌予後予測に応用した。
論文 参考訳(メタデータ) (2023-06-29T11:20:47Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - SimpleChrome: Encoding of Combinatorial Effects for Predicting Gene
Expression [8.326669256957352]
遺伝子のヒストン修飾表現を学習するディープラーニングモデルであるSimpleChromeを紹介します。
このモデルから得られた特徴により、遺伝子間相互作用の潜在効果と標的遺伝子の発現に対する直接遺伝子調節をよりよく理解することができます。
論文 参考訳(メタデータ) (2020-12-15T23:30:36Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Low-Rank Reorganization via Proportional Hazards Non-negative Matrix
Factorization Unveils Survival Associated Gene Clusters [9.773075235189525]
この研究において、Cox比例ハザードの回帰は生存制約を課すことでNMFと統合される。
ヒト癌遺伝子の発現データを用いて、提案手法は癌遺伝子の重要なクラスターを解明することができる。
発見された遺伝子クラスターは、豊富な生物学的含意を反映し、生存に関連するバイオマーカーの同定に役立つ。
論文 参考訳(メタデータ) (2020-08-09T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。