論文の概要: Patient-specific Biomolecular Instruction Tuning
- arxiv url: http://arxiv.org/abs/2509.22853v1
- Date: Fri, 26 Sep 2025 19:05:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:18.911358
- Title: Patient-specific Biomolecular Instruction Tuning
- Title(参考訳): 患者固有の生体分子インストラクションチューニング
- Authors: Irsyad Adam, Zekai Chen, David Laub, Shaun Porwal, Arda Pekis, Kevin Brown,
- Abstract要約: CPTAC-PROTSTRUCTは,オンコロジーの分子理解のための最初のインストラクションチューニングである。
また、患者固有のグラフ表現を学習し、臨床推論の強化を目的としたグラフLLMフレームワークであるKRONOSを提案する。
- 参考スコア(独自算出の注目度): 4.331279001189675
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteomics data is essential to pathogenic understanding of a disease phenotype. In cancer, analysis of molecular signatures enables precision medicine through the identification of biological processes that drive individualized tumor progression, therapeutic resistance, and clinical heterogeneity. Recent advances in multimodal large language models (LLMs) have shown remarkable capacity to integrate and reason across heterogeneous data modalities. However, performing multi-modal language modeling for molecular understanding of patient-specific proteomics remains a significant challenge due to two barriers: (1) the lack of instruction-tuning datasets that enable clinical interpretation from proteomics data, and (2) the absence of language modeling architectures designed to capture the rich heterogeneity of molecular data. In this work, we introduce CPTAC-PROTSTRUCT, the first instruction tuning dataset for molecular understanding of oncology, comprising over 400k open-ended examples derived from individualized proteomic profiles curated from the largest national proteomics cancer study (CPTAC). Additionally, we propose KRONOS (Knowledge Representation of patient Omics Networks in Oncology via Structured tuning), a novel graph-LLM framework that leverages molecular interaction topology with proteomics to learn patient-specific graph representations for enhanced clinical reasoning. We show that KRONOS achieves competitive performance across benchmark clinical tasks, including molecular classification, temporal trajectory modeling, and tumor stage prediction from proteomics data. Ultimately, this approach empowers LLMs to understand patient-level pathogenesis, advancing precision medicine through more accurate diagnosis, prognosis, and treatment stratification.
- Abstract(参考訳): プロテオミクスデータは、疾患の表現型の病原的理解に不可欠である。
がんにおいて、分子シグネチャの解析は、個別化された腫瘍進行、治療抵抗性、臨床異種性を促進する生物学的プロセスの同定を通じて、精密な医療を可能にする。
マルチモーダル大規模言語モデル(LLM)の最近の進歩は、異種データモダリティの統合と推論に顕著な能力を示している。
しかし、患者固有のプロテオミクスの分子理解のためのマルチモーダル言語モデリングの実行は、(1)プロテオミクスデータから臨床解釈が可能な命令チューニングデータセットの欠如、(2)分子データの豊富な不均一性を捉えるために設計された言語モデリングアーキテクチャの欠如という2つの障壁により、依然として重要な課題である。
本研究は,全国最大のプロテオミクスがん研究(CPTAC)から得られた個別化プロテオミクスプロファイルから400k以上のオープンエンドサンプルからなる,腫瘍学の分子理解のための最初のインストラクションチューニングデータセットであるCPTAC-PROTSTRUCTを紹介する。
さらに,プロテオミクスと分子相互作用トポロジを利用する新しいグラフ-LLMフレームワークであるKRONOS(Knowledge Representation of patient Omics Networks in Oncology via Structured tuning)を提案する。
KRONOSは, 分子分類, 時間的軌跡モデリング, およびプロテオミクスデータからの腫瘍ステージ予測など, ベンチマーク臨床上の課題において, 競争力を発揮することを示す。
最終的に、このアプローチはLLMに患者レベルの病原性を理解し、より正確な診断、予後、治療の成層化を通じて精密な医療を推進させる。
関連論文リスト
- Genome-Anchored Foundation Model Embeddings Improve Molecular Prediction from Histology Images [22.274588547000352]
PathLUPIは、トレーニング中に転写学的特権情報を使用して、ゲノムアンコールされた組織埋め込みを抽出する。
AUC $geq$ 0.80 in 14 of the biomarker prediction and molecular subtyping task and C-index $geq$ 0.70 in survive cohorts of 5 major cancer types。
論文 参考訳(メタデータ) (2025-06-24T14:48:12Z) - Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.044719143401664]
病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-03-01T07:02:30Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Generating counterfactual explanations of tumor spatial proteomes to
discover effective strategies for enhancing immune infiltration [44.99833362998488]
腫瘍微小環境(TME)は免疫組成により癌予後に大きな影響を及ぼす。
本稿では,T細胞浸潤予測を自己教師型機械学習問題として定式化する。
悪性黒色腫,大腸癌肝転移,乳癌データに枠組みを応用し,T細胞浸潤が予測される摂動を発見した。
論文 参考訳(メタデータ) (2022-11-08T05:46:02Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - Lesion Mask-based Simultaneous Synthesis of Anatomic and MolecularMR
Images using a GAN [59.60954255038335]
提案するフレームワークは,ストレッチアウトアップサンプリングモジュール,ブレインアトラスエンコーダ,セグメンテーション一貫性モジュール,マルチスケールラベルワイド識別器から構成される。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-06-26T02:50:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。