論文の概要: CancerLLM: A Large Language Model in Cancer Domain
- arxiv url: http://arxiv.org/abs/2406.10459v3
- Date: Tue, 01 Apr 2025 02:23:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-02 14:12:51.398690
- Title: CancerLLM: A Large Language Model in Cancer Domain
- Title(参考訳): CancerLLM: がん領域における大規模言語モデル
- Authors: Mingchen Li, Jiatan Huang, Jeremy Yeung, Anne Blaes, Steven Johnson, Hongfang Liu, Hua Xu, Rui Zhang,
- Abstract要約: CancerLLMは70億のパラメータとMistralスタイルのアーキテクチャを持つモデルで、270万近い臨床ノートと17種類のがんに関する515K以上の病理報告で事前訓練されている。
F1スコアは91.78%、表現型抽出は86.81%、ジガノア生成は86.81%である。
- 参考スコア(独自算出の注目度): 17.696798724373934
- License:
- Abstract: Medical Large Language Models (LLMs) have demonstrated impressive performance on a wide variety of medical NLP tasks; however, there still lacks a LLM specifically designed for phenotyping identification and diagnosis in cancer domain. Moreover, these LLMs typically have several billions of parameters, making them computationally expensive for healthcare systems. Thus, in this study, we propose CancerLLM, a model with 7 billion parameters and a Mistral-style architecture, pre-trained on nearly 2.7M clinical notes and over 515K pathology reports covering 17 cancer types, followed by fine-tuning on two cancer-relevant tasks, including cancer phenotypes extraction and cancer diagnosis generation. Our evaluation demonstrated that the CancerLLM achieves state-of-the-art results with F1 score of 91.78% on phenotyping extraction and 86.81% on disganois generation. It outperformed existing LLMs, with an average F1 score improvement of 9.23%. Additionally, the CancerLLM demonstrated its efficiency on time and GPU usage, and robustness comparing with other LLMs. We demonstrated that CancerLLM can potentially provide an effective and robust solution to advance clinical research and practice in cancer domain
- Abstract(参考訳): 医学大言語モデル(LLM)は、様々な医学的NLPタスクにおいて印象的な性能を示したが、がん領域における識別と診断の表現に特化して設計されたLLMはいまだに存在しない。
さらに、これらのLSMは一般的に数十億のパラメータを持ち、医療システムには計算コストがかかる。
そこで本研究では,70億のパラメータとMistralスタイルのアーキテクチャを持つモデルであるCancerLLMについて,17種類のがんを対象とする270万件近い臨床ノートと515万件以上の病理報告を事前訓練し,癌表現型抽出と癌診断生成を含む2つのがん関連タスクを微調整した。
以上の結果から,F1は表現型抽出で91.78%,ジガノア生成では86.81%であった。
既存のLLMよりも優れており、平均的なF1スコアは9.23%向上した。
さらに、CASELLMは、時間とGPU使用率の効率と、他のLLMと比較して堅牢性を示した。
私たちは、がん領域における臨床研究と実践の進展に有効な、堅牢なソリューションとして、がんLLMが有効である可能性を実証した。
関連論文リスト
- Cancer-Net PCa-Seg: Benchmarking Deep Learning Models for Prostate Cancer Segmentation Using Synthetic Correlated Diffusion Imaging [65.83291923029985]
前立腺癌(PCa)は米国で最も多いがんであり、約30,000人、全診断の29%、2024年に35,000人が死亡した。
前立腺特異的抗原 (PSA) 検査やMRI (MRI) などの従来のスクリーニング法は診断において重要であるが、特異性や一般化性には限界がある。
我々はU-Net、SegResNet、Swin UNETR、Attention U-Net、LightM-UNetといった最先端のディープラーニングモデルを用いて、200ドルのCDIからPCa病変を抽出する。
論文 参考訳(メタデータ) (2025-01-15T22:23:41Z) - Towards Non-invasive and Personalized Management of Breast Cancer Patients from Multiparametric MRI via A Large Mixture-of-Modality-Experts Model [19.252851972152957]
本稿では,マルチパラメトリックMRI情報を統一構造内に組み込んだMOMEについて報告する。
MOMEは乳癌の正確かつ堅牢な同定を証明した。
BI-RADS 4患者の生検の必要性を7.3%減らし、AUROC0.709で3重陰性乳癌を分類し、AUROC0.694でネオアジュバント化学療法に対する病理学的完全反応を予測することができる。
論文 参考訳(メタデータ) (2024-08-08T05:04:13Z) - A Large Language Model Pipeline for Breast Cancer Oncology [0.0]
最先端のOpenAIモデルは、2つの重要ながん治療因子に対する臨床データセットと臨床ガイドラインテキストコーパスに基づいて微調整された。
乳癌に対するアジュバント放射線療法と化学療法の分類において高い精度(0.85+)が得られた。
論文 参考訳(メタデータ) (2024-06-10T16:44:48Z) - Boosting Medical Image-based Cancer Detection via Text-guided Supervision from Reports [68.39938936308023]
本研究では, 高精度ながん検出を実現するための新しいテキスト誘導学習法を提案する。
本手法は,大規模プレトレーニングVLMによる臨床知識の活用により,一般化能力の向上が期待できる。
論文 参考訳(メタデータ) (2024-05-23T07:03:38Z) - Improving Breast Cancer Grade Prediction with Multiparametric MRI Created Using Optimized Synthetic Correlated Diffusion Imaging [71.91773485443125]
乳がん治療計画において、グレーディングは重要な役割を担っている。
現在の腫瘍グレード法では、患者から組織を抽出し、ストレス、不快感、医療費の上昇につながる。
本稿では,CDI$s$の最適化による乳癌の診断精度の向上について検討する。
論文 参考訳(メタデータ) (2024-05-13T15:48:26Z) - Narrative Feature or Structured Feature? A Study of Large Language Models to Identify Cancer Patients at Risk of Heart Failure [21.660602700862714]
本研究は, 心不全リスクのあるがん患者を同定するための機械学習モデルについて検討した。
肺がん,乳がん,大腸癌と診断され,フロリダ大学から12,806人のがんコホートを同定した。
提案した物語は,特徴密度が著しく増加し,性能が向上した。
論文 参考訳(メタデータ) (2024-03-18T02:42:01Z) - Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep
Radiomic Features from Synthetic Correlated Diffusion Imaging [82.74877848011798]
乳がんの流行は成長を続けており、2023年には米国で約30万人の女性に影響を及ぼした。
金標準のScarff-Bloom-Richardson(SBR)グレードは、化学療法に対する患者の反応を一貫して示すことが示されている。
本稿では,合成相関拡散(CDI$s$)画像を用いた乳がん鑑定における深層学習の有効性について検討する。
論文 参考訳(メタデータ) (2023-04-12T15:08:34Z) - A Multi-Institutional Open-Source Benchmark Dataset for Breast Cancer
Clinical Decision Support using Synthetic Correlated Diffusion Imaging Data [82.74877848011798]
Cancer-Net BCaは、乳がん患者の画像データであるボリュームCDI$s$の複数機関のオープンソースベンチマークデータセットである。
Cancer-Net BCaは、機械学習の進歩を加速し、がんと戦う臨床医を助ける、グローバルなオープンソースイニシアチブの一部として、一般公開されている。
論文 参考訳(メタデータ) (2023-04-12T05:41:44Z) - CancerUniT: Towards a Single Unified Model for Effective Detection,
Segmentation, and Diagnosis of Eight Major Cancers Using a Large Collection
of CT Scans [45.83431075462771]
ヒトの読者や放射線医は、臨床実践において、全身多臓器多臓器の検出と診断を日常的に行う。
ほとんどの医療用AIシステムは、いくつかの疾患のリストの狭い単一の臓器に焦点を当てて構築されている。
CancerUniT は、マルチ腫瘍予測の出力を持つクエリベースの Mask Transformer モデルである。
論文 参考訳(メタデータ) (2023-01-28T20:09:34Z) - Improving Precancerous Case Characterization via Transformer-based
Ensemble Learning [31.891340667123124]
自然言語処理のがん病理学報告への応用は、がん症例の検出に焦点が当てられている。
先天性腺腫のキャラクタリゼーションの改善は、早期がんの検出と予防のための診断試験の開発を支援する。
以上の結果から,NLPを用いて早期がん予防のための診断試験の開発を促進できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-12-10T00:06:28Z) - Enhancing Clinical Support for Breast Cancer with Deep Learning Models
using Synthetic Correlated Diffusion Imaging [66.63200823918429]
深層学習モデルを用いた乳癌に対する臨床支援の強化について検討した。
我々は、体積畳み込みニューラルネットワークを利用して、前処理コホートから深い放射能特徴を学習する。
提案手法は, グレードと処理後応答予測の両方において, より良い性能を実現することができる。
論文 参考訳(メタデータ) (2022-11-10T03:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。