論文の概要: Can Language Models Identify Side Effects of Breast Cancer Radiation Treatments?
- arxiv url: http://arxiv.org/abs/2605.08439v1
- Date: Fri, 08 May 2026 20:02:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.644574
- Title: Can Language Models Identify Side Effects of Breast Cancer Radiation Treatments?
- Title(参考訳): 言語モデルは乳癌放射線治療の副作用を識別できるか?
- Authors: Natalie Seah, Danielle S. Bitterman, Daphna Spiegel, Thomas Hartvigsen,
- Abstract要約: 大きな言語モデル(LLM)は、がんの生存者に対する治療副作用のコミュニケーションを支援する可能性がある。
乳がん治療と生存医療におけるLSMによる放射線副作用リストを評価するためのデプロイ指向ストレステストフレームワークを提案する。
- 参考スコア(独自算出の注目度): 11.63686452031873
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately communicating the side effects of cancer treatments to cancer survivors is critical, particularly in settings such as informed consent, where clinicians must clearly and comprehensively convey potential treatment toxicities. However, this task remains challenging due to clinical knowledge deficits about adverse treatment effects and fragmentation across electronic health record (EHR) systems. Large language models (LLMs) have the potential to assist in this task, though their reliability in oncology survivorship contexts remains poorly understood. We present a deployment-oriented stress-testing framework for evaluating LLM-generated radiation side effect lists in breast cancer treatment and survivorship care. Using 21 breast cancer patient profiles, we construct paired patient clinical scenarios that differ only in radiotherapy regimens to evaluate seven instruction-tuned LLMs under multiple prompting regimes. We then compare LLM outputs to a clinician-curated reference derived from informed consent documents at two major academic medical centers and developed by a team including more than seven breast radiation oncologists. The reference maps radiation dose-fractionation, fields, and locations to associated toxicities, broken down by frequency and temporal onset. Across models, we reveal sensitivity to minor documentation changes, trade-offs between precision and recall, and systematic under-recall of rare and long-term side effects. When used alone, constraints on the number of side effects generated reduce precision, and grounding outputs in clinician-curated side effect lists substantially improves reliability and robustness. These findings highlight important limitations of LLM use in oncology and suggest practical design choices for safer and more informative survivorship-focused applications.
- Abstract(参考訳): がん治療の副作用をがん患者に正確に伝えることは、特に、臨床医が潜在的治療毒性を明確かつ包括的に伝達する必要がある、インフォームド・コンセントのような設定において重要である。
しかし、この課題は、電子健康記録(EHR)システムにまたがる有害な治療効果と断片化に関する臨床知識不足のため、依然として困難である。
大規模言語モデル(LLM)はこのタスクを補助する可能性を持っているが、オンコロジーの生存状況における信頼性はいまだによく分かっていない。
乳がん治療と生存医療におけるLSMによる放射線副作用リストを評価するためのデプロイ指向ストレステストフレームワークを提案する。
21例の乳がん患者プロファイルを用いて,放射線治療法で異なる2例の臨床シナリオを構築し,複数のプロンプト療法法で7例のLSMを評価した。
次に, 乳房放射線腫瘍専門医を含む7名以上の研究チームによって開発された2大学術医療センターにおけるインフォームドコンセント文書から得られた臨床検診結果と比較した。
基準は放射線線量制限、フィールド、および場所を関連する毒性にマッピングし、周波数と時間的オンセットによって分解する。
モデル全体では、小さなドキュメントの変更に対する感受性、精度とリコールのトレードオフ、稀かつ長期的な副作用の体系的アンダーリコールを明らかにする。
単独で使用する場合、生成した副作用の数に対する制約は精度を低下させ、クリニカルカレートされた副作用リストのアウトプットは信頼性とロバスト性を大幅に向上させる。
これらの知見は, 腫瘍学におけるLLMの使用に関する重要な限界を浮き彫りにし, より安全でより情報に富む生存型アプリケーションのための実用的な設計選択を示唆している。
関連論文リスト
- Automated Clinical Report Generation for Remote Cognitive Remediation: Comparing Knowledge-Engineered Templates and LLMs in Low-Resource Settings [4.406830461180521]
本稿では,アバター誘導型ホームベース認知修復セッションの低リソース環境における自動臨床報告生成について検討する。
本稿では,(1)言語治療領域の知識を明示的な決定規則として符号化するルールベースのテンプレートシステムと,(2)より流動的で簡潔な出力を目的としたゼロショットLCMベースのアプローチ(GPT-4)を提案する。
結果,臨床信頼性と言語学的品質の間には明確なトレードオフがみられ,GPT-4はより簡潔なアウトプットを生み出す一方,テンプレートベースシステムは流動性,コヒーレンス,結果提示により高いスコアを付けた。
論文 参考訳(メタデータ) (2026-05-07T17:20:22Z) - LLM Augmented Intervenable Multimodal Adaptor for Post-operative Complication Prediction in Lung Cancer Surgery [7.921472998621774]
肺癌術後合併症のリスクを予測するための深層学習アーキテクチャであるMIRACLEを提案する。
MIRACLEはヘテロジニアス入力の超球面埋め込み空間融合を採用し、堅牢で差別的な特徴の抽出を可能にする。
我々は,Roswell Park Comprehensive Cancer Centerで手術を受けた3,094人の肺癌患者を対象とした実世界のPOC-Lに対するアプローチを検証した。
論文 参考訳(メタデータ) (2026-01-20T16:58:12Z) - Boosted Random Forests for Predicting Treatment Failure of Chemotherapy Regimens [0.0]
患者のプロファイルから収集したリアルワールドエビデンス(RWE)に基づいた治療失敗モデルを構築した。
最も頻度の高い治療失敗(または中止)を伴う5種類の原発性癌の症例を経験したので報告する。
論文 参考訳(メタデータ) (2025-12-10T13:49:26Z) - CAST: Time-Varying Treatment Effects with Application to Chemotherapy and Radiotherapy on Head and Neck Squamous Cell Carcinoma [5.675082242330025]
治療後の持続的機能として治療効果をモデル化する新しいフレームワークであるCAST(Causal Analysis for Survival Trajectories)を紹介する。
CASTは、治療効果の上昇、ピーク、減少をフォローアップ期間を通じて明らかにし、臨床医が治療効果を最大化する時期と時期を決定するのに役立つ。
論文 参考訳(メタデータ) (2025-05-09T18:19:41Z) - Benchmarking LLMs and SLMs for patient reported outcomes [0.0]
本研究は,放射線治療の文脈における患者報告Q&Aフォームの要約のためのLSMに対して,いくつかのSLMをベンチマークする。
各種測定値を用いて精度と信頼性を評価する。
この調査結果は、高度な医療タスクのためのSLMの約束と制限の両方を強調し、より効率的でプライバシ保護のAI駆動型ヘルスケアソリューションを促進する。
論文 参考訳(メタデータ) (2024-12-20T19:01:25Z) - Boosting Medical Image-based Cancer Detection via Text-guided Supervision from Reports [68.39938936308023]
本研究では, 高精度ながん検出を実現するための新しいテキスト誘導学習法を提案する。
本手法は,大規模プレトレーニングVLMによる臨床知識の活用により,一般化能力の向上が期待できる。
論文 参考訳(メタデータ) (2024-05-23T07:03:38Z) - LLM-driven Multimodal Target Volume Contouring in Radiation Oncology [46.23891509553877]
大規模言語モデル(LLM)は、テキスト情報と画像の統合を容易にする。
LLM駆動型マルチモーダルAI,すなわちLLMSegを提案する。
提案モデルでは,従来のユニモーダルAIモデルと比較して,性能が著しく向上していることが実証された。
論文 参考訳(メタデータ) (2023-11-03T13:38:42Z) - A new algorithm for Subgroup Set Discovery based on Information Gain [58.720142291102135]
Information Gained Subgroup Discovery (IGSD)は、パターン発見のための新しいSDアルゴリズムである。
IGSDと最先端の2つのSDアルゴリズム(FSSDとSSD++)を比較した。
IGSDはFSSDやSSD++よりもOR値が優れており、パターンとターゲットへの依存度が高い。
論文 参考訳(メタデータ) (2023-07-26T21:42:34Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - MIA-Prognosis: A Deep Learning Framework to Predict Therapy Response [58.0291320452122]
本稿では,患者の予後と治療反応を予測するための統合型深層学習手法を提案する。
我々は,マルチモーダル非同期時系列分類タスクとして,確率モデリングを定式化する。
我々の予測モデルは、長期生存の観点から、低リスク、高リスクの患者をさらに階層化する可能性がある。
論文 参考訳(メタデータ) (2020-10-08T15:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。