論文の概要: Multi-Task LLM with LoRA Fine-Tuning for Automated Cancer Staging and Biomarker Extraction
- arxiv url: http://arxiv.org/abs/2604.13328v1
- Date: Tue, 14 Apr 2026 22:26:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.31883
- Title: Multi-Task LLM with LoRA Fine-Tuning for Automated Cancer Staging and Biomarker Extraction
- Title(参考訳): LoRAファインチューニングを用いたマルチタスクLCMによる癌検診・バイオマーカー抽出
- Authors: Jiahao Shao, Anam Nawaz Khan, Christopher Brett, Tom Berg, Xueping Li, Bing Yao,
- Abstract要約: 本研究では,腫瘍リンパ節転移(TNM)のステージング,組織学的グレード,バイオマーカーの抽出を自動化するためのパラメータ効率,マルチタスクフレームワークを提案する。
Llama-3-8B-Instruct encoderをLoRA(Lo-Rank Adaptation)を用いて10,677のレポートをキュレートして検証した。
- 参考スコア(独自算出の注目度): 6.53191669778827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pathology reports serve as the definitive record for breast cancer staging, yet their unstructured format impedes large-scale data curation. While Large Language Models (LLMs) offer semantic reasoning, their deployment is often limited by high computational costs and hallucination risks. This study introduces a parameter-efficient, multi-task framework for automating the extraction of Tumor-Node-Metastasis (TNM) staging, histologic grade, and biomarkers. We fine-tune a Llama-3-8B-Instruct encoder using Low-Rank Adaptation (LoRA) on a curated, expert-verified dataset of 10,677 reports. Unlike generative approaches, our architecture utilizes parallel classification heads to enforce consistent schema adherence. Experimental results demonstrate that the model achieves a Macro F1 score of 0.976, successfully resolving complex contextual ambiguities and heterogeneous reporting formats that challenge traditional extraction methods including rule-based natural language processing (NLP) pipelines, zero-shot LLMs, and single-task LLM baselines. The proposed adapter-efficient, multi-task architecture enables reliable, scalable pathology-derived cancer staging and biomarker profiling, with the potential to enhance clinical decision support and accelerate data-driven oncology research.
- Abstract(参考訳): 病理報告は乳がんのステージングにおける決定的な記録となっているが、その非構造的フォーマットは大規模なデータキュレーションを妨げている。
大きな言語モデル(LLM)は意味論的推論を提供するが、その展開は高い計算コストと幻覚リスクによって制限されることが多い。
本研究では,腫瘍リンパ節転移(TNM)のステージング,組織学的グレード,バイオマーカーの抽出を自動化するためのパラメータ効率,マルチタスクフレームワークを提案する。
Llama-3-8B-Instruct encoderをLoRA(Lo-Rank Adaptation)を用いて10,677のレポートをキュレートして検証した。
生成的アプローチとは異なり、我々のアーキテクチャは並列分類ヘッドを使用して一貫したスキーマアテンデンスを強制する。
実験結果から, ルールベース自然言語処理(NLP)パイプライン, ゼロショットLLM, シングルタスクLLMベースラインを含む従来の抽出手法に挑戦する, 複雑な文脈の曖昧さと異種報告フォーマットの解消に成功したマクロF1スコア0.976が得られた。
提案したアダプタ効率・マルチタスクアーキテクチャは、信頼性が高くスケーラブルな病理由来の癌ステージングおよびバイオマーカープロファイリングを可能にし、臨床決定支援を強化し、データ駆動型腫瘍研究を加速する可能性がある。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Evaluation of Oncotimia: An LLM based system for supporting tumour boards [0.0]
ONCOTIMIAは、生成人工知能(GenAI)を腫瘍学に統合するためのモジュラーツールである。
大型言語モデル(LLMs)を用いた肺癌腫瘍の自動切除への応用について検討した。
肺がん症例10例を対象に,AWS Bedrockを介する6例のLCMの性能評価を行った。
論文 参考訳(メタデータ) (2026-01-27T18:59:38Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Enhancing Lung Cancer Treatment Outcome Prediction through Semantic Feature Engineering Using Large Language Models [5.778370321351782]
GKC(Goal-oriented Knowledge Curators)として,LLM(Large Language Models)を用いたフレームワークを導入する。
GKCは、実験室、ゲノム、薬品のデータを高忠実でタスク整合性のある特徴に変換する。
我々はGKCを専門家が設計した機能、直接テキスト埋め込み、エンドツーエンドのトランスフォーマーと比較した。
論文 参考訳(メタデータ) (2025-12-01T23:56:45Z) - Knowledge Elicitation with Large Language Models for Interpretable Cancer Stage Identification from Pathology Reports [2.5829043503611318]
本稿では,大きな言語モデルによるがんステージングのためのドメイン固有のルールの推論と適用を可能にすることにより,制限を克服する2つの知識抽出手法を提案する。
1つ目は、KEwLTM(Knowledge Elicitation with Long-Term Memory)で、未発表の病理報告から直接ステージングルールを導出するために反復的なプロンプト戦略を使用している。
第2のKEwRAG(Knowledge Elicitation with Retrieval-Augmented Generation)では、ルールを関連するガイドラインから1ステップで事前抽出し、適用することで、解釈可能性を高め、繰り返しのリカバリオーバーヘッドを回避するという、RAGのバリエーションを採用している。
論文 参考訳(メタデータ) (2025-11-02T19:00:40Z) - OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - AMRG: Extend Vision Language Models for Automatic Mammography Report Generation [4.366802575084445]
マンモグラフィーレポート生成は、医療AIにおいて重要で未発見の課題である。
マンモグラフィーレポートを生成するための最初のエンドツーエンドフレームワークであるAMRGを紹介する。
DMIDを用いた高分解能マンモグラフィーと診断レポートの公開データセットであるAMRGのトレーニングと評価を行った。
論文 参考訳(メタデータ) (2025-08-12T06:37:41Z) - End-to-End Breast Cancer Radiotherapy Planning via LMMs with Consistency Embedding [47.360760580820966]
放射線腫瘍学の分野に適した包括的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
このモデルは臨床ワークフロー内の一連のタスクを効果的に管理し、臨床コンテキストの要約、放射線治療計画の提案、計画誘導されたターゲットボリュームセグメンテーションを含む。
クリーン入力処理の整合性を維持しつつ,LMMのノイズ入力に対する堅牢性を向上する,CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。