論文の概要: An Interpretable Machine Learning Framework for Non-Small Cell Lung Cancer Drug Response Analysis
- arxiv url: http://arxiv.org/abs/2603.16330v1
- Date: Tue, 17 Mar 2026 10:01:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.211168
- Title: An Interpretable Machine Learning Framework for Non-Small Cell Lung Cancer Drug Response Analysis
- Title(参考訳): 非小細胞肺癌薬剤応答解析のための解釈可能な機械学習フレームワーク
- Authors: Ann Rachel, Pranav M Pawar, Mithun Mukharjee, Raja M, Tojo Mathew,
- Abstract要約: パーソナライズドメディカルでは、治療は個人の遺伝情報と生活様式に応じて調整される。
本稿では,遺伝子プロファイルに着目した患者データを用いたパーソナライズされた治療計画の開発に焦点をあてる。
がんにおける薬物感受性ゲノミクスのマルチオミクスデータは、予測モデルを構築するために使われてきた。
XGBoostorは、がんデータセットから抽出された分子的および細胞的特徴に焦点を当てた薬物応答を予測するために使用される。
- 参考スコア(独自算出の注目度): 3.416642353308202
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lung cancer is a condition where there is abnormal growth of malignant cells that spread in an uncontrollable fashion in the lungs. Some common treatment strategies are surgery, chemotherapy, and radiation which aren't the best options due to the heterogeneous nature of cancer. In personalized medicine, treatments are tailored according to the individual's genetic information along with lifestyle aspects. In addition, AI-based deep learning methods can analyze large sets of data to find early signs of cancer, types of tumor, and prospects of treatment. The paper focuses on the development of personalized treatment plans using specific patient data focusing primarily on the genetic profile. Multi-Omics data from Genomics of Drug Sensitivity in Cancer have been used to build a predictive model along with machine learning techniques. The value of the target variable, LN-IC50, determines how sensitive or resistive a drug is. An XGBoost regressor is utilized to predict the drug response focusing on molecular and cellular features extracted from cancer datasets. Cross-validation and Randomized Search are performed for hyperparameter tuning to further optimize the model's predictive performance. For explanation purposes, SHAP (SHapley Additive exPlanations) was used. SHAP values measure each feature's impact on an individual prediction. Furthermore, interpreting feature relationships was performed using DeepSeek, a large language model trained to verify the biological validity of the features. Contextual explanations regarding the most important genes or pathways were provided by DeepSeek alongside the top SHAP value constituents, supporting the predictability of the model.
- Abstract(参考訳): 肺癌は、肺に制御不能な方法で拡散する悪性細胞の異常な増殖がある状態である。
一般的な治療法は、手術、化学療法、放射線であり、がんの異種性のために最良の選択肢ではない。
パーソナライズドメディカルでは、治療は個人の遺伝情報と生活様式に応じて調整される。
さらに、AIベースのディープラーニング手法は、大量のデータを分析して、癌の早期徴候、腫瘍の種類、治療の見通しを見つけることができる。
本論文は、主に遺伝子プロファイルに着目した特定の患者データを用いたパーソナライズされた治療計画の開発に焦点を当てる。
がんにおける薬物感受性ゲノミクスのマルチオミクスデータは、機械学習技術とともに予測モデルを構築するために使われてきた。
標的変数であるLN-IC50の値は、薬物の感度や抵抗性を決定する。
XGBoost回帰器を用いて、がんデータセットから抽出された分子的および細胞的特徴に着目した薬物応答を予測する。
クロスバリデーションとランダム検索はハイパーパラメータチューニングのために行われ、モデルの予測性能をさらに最適化する。
説明のためにSHAP(SHapley Additive exPlanations)が用いられた。
SHAP値は、個々の予測に対する各機能のインパクトを測定する。
さらに,特徴の生物学的妥当性を検証するために訓練された大規模言語モデルであるDeepSeekを用いて特徴関係の解釈を行った。
最も重要な遺伝子や経路に関する文脈的説明は、DeepSeekによって上位のSHAP値成分と共に提供され、モデルの予測可能性を支持した。
関連論文リスト
- Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。
我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。
乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文 参考訳(メタデータ) (2026-01-29T14:06:50Z) - A Novel Recurrent Neural Network Framework for Prediction and Treatment of Oncogenic Mutation Progression [0.21485350418225244]
米国では、毎年60万人以上が死亡している。
新たな分野の1つ、経路分析は有望だが、それでも手動で導いたウェットラボのデータに依存している。
本研究は,人工知能(AI)に基づく経路解析のための効率的なエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-16T06:46:28Z) - PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset [10.326278779332219]
肺癌における遺伝子変異、変異サブタイプおよびそれらのエクソンの正確な予測は、パーソナライズされた治療計画と予後評価に重要である。
病理組織像と次世代シークエンシングレポートを組み合わせたPathGeneを収集した。
このマルチセンターデータセットは、全スライディングイメージをドライバ遺伝子変異状態、突然変異サブタイプ、エキソン、腫瘍突然変異負担(TMB)ステータスにリンクする。
論文 参考訳(メタデータ) (2025-05-30T11:51:11Z) - Predicting Survivability of Cancer Patients with Metastatic Patterns Using Explainable AI [2.6182192515316247]
本研究は、転移パターンを有するがん患者の生存可能性を予測するために機械学習(ML)を活用する。
MSK-METデータセットには、27種類のがんの25,775人のゲノムおよび臨床データが含まれている。
XGBoost は曲線 (AUC) が 0.82 である最高のパフォーマーとして登場した。
論文 参考訳(メタデータ) (2025-04-07T20:48:15Z) - Semi-Supervised Learning for Dose Prediction in Targeted Radionuclide: A Synthetic Data Study [42.75913504373651]
TRT(Targeted Radionuclide Therapy)は、がん細胞に特異的に強力な放射線照射を投与することを目的とした、放射線腫瘍学の現代的な戦略である。
深層学習はRTをパーソナライズすることを約束する。
現在の方法では大量のSPECT画像撮影が必要であるが、日常的な臨床実践では達成できない。
論文 参考訳(メタデータ) (2025-03-07T12:21:09Z) - Prediction of Lung Metastasis from Hepatocellular Carcinoma using the SEER Database [0.9055332067000195]
肝細胞癌(HCC)は、がん関連死亡の原因である。
HCCにおける肺転移の予測モデルは、範囲と臨床応用性に限られている。
本研究では,Surveillance, Epidemiology, End Results (SEER)データベースのデータを用いて,エンドツーエンドの機械学習パイプラインの開発と検証を行う。
論文 参考訳(メタデータ) (2025-01-20T20:06:31Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。