論文の概要: Genotype-Phenotype Integration through Machine Learning and Personalized Gene Regulatory Networks for Cancer Metastasis Prediction
- arxiv url: http://arxiv.org/abs/2510.23620v1
- Date: Wed, 22 Oct 2025 05:20:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 17:50:20.165119
- Title: Genotype-Phenotype Integration through Machine Learning and Personalized Gene Regulatory Networks for Cancer Metastasis Prediction
- Title(参考訳): 癌転移予測のための機械学習とパーソナライズされた遺伝子制御ネットワークによる遺伝子型フェノタイプ統合
- Authors: Jiwei Fu, Chunyu Yang, Charalampos P. Triantafyllidis,
- Abstract要約: 転移はがんによる死亡の原因である。
古典的な機械学習とディープラーニングを統合して、複数のがんタイプにわたる転移能を予測する。
- 参考スコア(独自算出の注目度): 1.7895738175272824
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Metastasis is the leading cause of cancer-related mortality, yet most predictive models rely on shallow architectures and neglect patient-specific regulatory mechanisms. Here, we integrate classical machine learning and deep learning to predict metastatic potential across multiple cancer types. Gene expression profiles from the Cancer Cell Line Encyclopedia were combined with a transcription factor-target prior from DoRothEA, focusing on nine metastasis-associated regulators. After selecting differential genes using the Kruskal-Wallis test, ElasticNet, Random Forest, and XGBoost models were trained for benchmarking. Personalized gene regulatory networks were then constructed using PANDA and LIONESS and analyzed through a graph attention neural network (GATv2) to learn topological and expression-based representations. While XGBoost achieved the highest AUROC (0.7051), the GNN captured non-linear regulatory dependencies at the patient level. These results demonstrate that combining traditional machine learning with graph-based deep learning enables a scalable and interpretable framework for metastasis risk prediction in precision oncology.
- Abstract(参考訳): 転移はがん関連死亡の主な原因であるが、ほとんどの予測モデルは浅いアーキテクチャに依存し、患者固有の規制機構を無視している。
ここでは, 従来の機械学習とディープラーニングを統合して, 複数のがんタイプにまたがる転移能を予測する。
癌細胞株百科事典の遺伝子発現プロファイルは、9つの転移関連調節因子に焦点をあてて、DoRothEAの転写因子標的と組み合わせた。
Kruskal-Wallisテストを用いて異なる遺伝子を選択すると、ElasticNet、Random Forest、XGBoostモデルがベンチマークのために訓練された。
パーソナライズされた遺伝子制御ネットワークは、PANDAとLIONESSを使用して構築され、グラフアテンションニューラルネットワーク(GATv2)を通して分析され、トポロジと表現に基づく表現を学習する。
XGBoost は AUROC (0.7051) の最高値に達したが、GNN は患者レベルでの非線形規制の依存関係を捉えた。
これらの結果は、従来の機械学習とグラフベースのディープラーニングを組み合わせることで、精度オンコロジーにおける転移リスク予測のためのスケーラブルで解釈可能なフレームワークを実現できることを示している。
関連論文リスト
- GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Explainable Multilayer Graph Neural Network for Cancer Gene Prediction [21.83218536069088]
本稿では,癌遺伝子の同定にEMGNN(Explainable Multilayer Graph Neural Network)アプローチを提案する。
単一の生物学的ネットワーク上の従来のグラフ学習とは異なり、EMGNNは多層グラフニューラルネットワークを使用して、複数の生物学的ネットワークから正確ながん遺伝子予測を学習する。
提案手法は, 従来手法よりも平均7.15%, 精度・リコール曲線 (AUPR) で改善されている。
論文 参考訳(メタデータ) (2023-01-20T23:57:12Z) - Collaborative learning of images and geometrics for predicting
isocitrate dehydrogenase status of glioma [8.262398325144774]
IDH変異検出のゴールド標準は、侵襲的なアプローチによって得られた腫瘍組織を必要とし、通常は高価である。
近年の放射線ゲノミクスの進歩は、MRIに基づくIDH変異を予測する非侵襲的アプローチを提供する。
本稿では、畳み込みニューラルネットワーク(CNN)とグラフニューラルネットワーク(GNN)を用いて、腫瘍画像と腫瘍幾何学の両方を学習する協調学習フレームワークを提案する。
その結果,提案モデルは3D-DenseNet121のベースラインモデルよりも優れていた。
論文 参考訳(メタデータ) (2022-01-14T15:58:07Z) - Transcriptome-wide prediction of prostate cancer gene expression from
histopathology images using co-expression based convolutional neural networks [0.8874479658912061]
形態と遺伝子発現の関係を特異的にモデル化する新しい計算効率の高い手法を提案する。
前立腺癌におけるRNA塩基配列推定のためのCNNを用いた第1回トランスクリプトーム解析を行った。
論文 参考訳(メタデータ) (2021-04-19T13:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。