論文の概要: CancerLLM: A Large Language Model in Cancer Domain
- arxiv url: http://arxiv.org/abs/2406.10459v2
- Date: Sun, 1 Sep 2024 14:28:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-04 17:51:09.090642
- Title: CancerLLM: A Large Language Model in Cancer Domain
- Title(参考訳): CancerLLM: がん領域における大規模言語モデル
- Authors: Mingchen Li, Jiatan Huang, Jeremy Yeung, Anne Blaes, Steven Johnson, Hongfang Liu, Hua Xu, Rui Zhang,
- Abstract要約: CancerLLMは70億のパラメータとMistralスタイルのアーキテクチャを持つモデルで、17のがんタイプをカバーする2,676,642の臨床ノートと515,524の病理報告で事前訓練されている。
以上の結果から,ClancLLMは既存LLMと比較して平均F1スコアが7.61 %向上した。
- 参考スコア(独自算出の注目度): 17.696798724373934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical Large Language Models (LLMs) such as ClinicalCamel 70B, Llama3-OpenBioLLM 70B have demonstrated impressive performance on a wide variety of medical NLP task.However, there still lacks a large language model (LLM) specifically designed for cancer domain. Moreover, these LLMs typically have billions of parameters, making them computationally expensive for healthcare systems.Thus, in this study, we propose CancerLLM, a model with 7 billion parameters and a Mistral-style architecture, pre-trained on 2,676,642 clinical notes and 515,524 pathology reports covering 17 cancer types, followed by fine-tuning on three cancer-relevant tasks, including cancer phenotypes extraction, and cancer diagnosis generation. Our evaluation demonstrated that CancerLLM achieves state-of-the-art results compared to other existing LLMs, with an average F1 score improvement of 7.61 %. Additionally, CancerLLM outperforms other models on two proposed robustness testbeds. This illustrates that CancerLLM can be effectively applied to clinical AI systems, enhancing clinical research and healthcare delivery in the field of cancer.
- Abstract(参考訳): 臨床カメラ70BやLlama3-OpenBioLLM70Bのような医療用大言語モデル(LLM)は、様々な医療用NLPタスクにおいて印象的な性能を示してきたが、がん領域に特化した大規模言語モデル(LLM)はいまだに存在しない。
さらに、これらのLSMは、典型的には数十億のパラメータを持ち、医療システムには計算コストがかかるが、本研究では、70億のパラメータとMistralスタイルのアーキテクチャを持つモデルであるCancerLLMを提案し、17種類のがんを対象とする2,676,642の臨床ノートと515,524の病理報告を事前訓練し、がんの表現型抽出、がん診断生成を含む3つのがん関連タスクを微調整した。
以上の結果から,ClancLLMは既存のLLMと比較して平均F1スコアが7.61 %向上した。
さらに、CASELLMは2つの提案された堅牢性テストベッドで他のモデルよりも優れている。
このことは、がんLLMが臨床AIシステムに効果的に適用され、がん分野における臨床研究と医療提供が促進されることを示している。
関連論文リスト
- Towards Non-invasive and Personalized Management of Breast Cancer Patients from Multiparametric MRI via A Large Mixture-of-Modality-Experts Model [19.252851972152957]
本稿では,マルチパラメトリックMRI情報を統一構造内に組み込んだMOMEについて報告する。
MOMEは乳癌の正確かつ堅牢な同定を証明した。
BI-RADS 4患者の生検の必要性を7.3%減らし、AUROC0.709で3重陰性乳癌を分類し、AUROC0.694でネオアジュバント化学療法に対する病理学的完全反応を予測することができる。
論文 参考訳(メタデータ) (2024-08-08T05:04:13Z) - A Large Language Model Pipeline for Breast Cancer Oncology [0.0]
最先端のOpenAIモデルは、2つの重要ながん治療因子に対する臨床データセットと臨床ガイドラインテキストコーパスに基づいて微調整された。
乳癌に対するアジュバント放射線療法と化学療法の分類において高い精度(0.85+)が得られた。
論文 参考訳(メタデータ) (2024-06-10T16:44:48Z) - Boosting Medical Image-based Cancer Detection via Text-guided Supervision from Reports [68.39938936308023]
本研究では, 高精度ながん検出を実現するための新しいテキスト誘導学習法を提案する。
本手法は,大規模プレトレーニングVLMによる臨床知識の活用により,一般化能力の向上が期待できる。
論文 参考訳(メタデータ) (2024-05-23T07:03:38Z) - Improving Breast Cancer Grade Prediction with Multiparametric MRI Created Using Optimized Synthetic Correlated Diffusion Imaging [71.91773485443125]
乳がん治療計画において、グレーディングは重要な役割を担っている。
現在の腫瘍グレード法では、患者から組織を抽出し、ストレス、不快感、医療費の上昇につながる。
本稿では,CDI$s$の最適化による乳癌の診断精度の向上について検討する。
論文 参考訳(メタデータ) (2024-05-13T15:48:26Z) - Narrative Feature or Structured Feature? A Study of Large Language Models to Identify Cancer Patients at Risk of Heart Failure [21.660602700862714]
本研究は, 心不全リスクのあるがん患者を同定するための機械学習モデルについて検討した。
肺がん,乳がん,大腸癌と診断され,フロリダ大学から12,806人のがんコホートを同定した。
提案した物語は,特徴密度が著しく増加し,性能が向上した。
論文 参考訳(メタデータ) (2024-03-18T02:42:01Z) - Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep
Radiomic Features from Synthetic Correlated Diffusion Imaging [82.74877848011798]
乳がんの流行は成長を続けており、2023年には米国で約30万人の女性に影響を及ぼした。
金標準のScarff-Bloom-Richardson(SBR)グレードは、化学療法に対する患者の反応を一貫して示すことが示されている。
本稿では,合成相関拡散(CDI$s$)画像を用いた乳がん鑑定における深層学習の有効性について検討する。
論文 参考訳(メタデータ) (2023-04-12T15:08:34Z) - A Multi-Institutional Open-Source Benchmark Dataset for Breast Cancer
Clinical Decision Support using Synthetic Correlated Diffusion Imaging Data [82.74877848011798]
Cancer-Net BCaは、乳がん患者の画像データであるボリュームCDI$s$の複数機関のオープンソースベンチマークデータセットである。
Cancer-Net BCaは、機械学習の進歩を加速し、がんと戦う臨床医を助ける、グローバルなオープンソースイニシアチブの一部として、一般公開されている。
論文 参考訳(メタデータ) (2023-04-12T05:41:44Z) - CancerUniT: Towards a Single Unified Model for Effective Detection,
Segmentation, and Diagnosis of Eight Major Cancers Using a Large Collection
of CT Scans [45.83431075462771]
ヒトの読者や放射線医は、臨床実践において、全身多臓器多臓器の検出と診断を日常的に行う。
ほとんどの医療用AIシステムは、いくつかの疾患のリストの狭い単一の臓器に焦点を当てて構築されている。
CancerUniT は、マルチ腫瘍予測の出力を持つクエリベースの Mask Transformer モデルである。
論文 参考訳(メタデータ) (2023-01-28T20:09:34Z) - Improving Precancerous Case Characterization via Transformer-based
Ensemble Learning [31.891340667123124]
自然言語処理のがん病理学報告への応用は、がん症例の検出に焦点が当てられている。
先天性腺腫のキャラクタリゼーションの改善は、早期がんの検出と予防のための診断試験の開発を支援する。
以上の結果から,NLPを用いて早期がん予防のための診断試験の開発を促進できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-12-10T00:06:28Z) - Enhancing Clinical Support for Breast Cancer with Deep Learning Models
using Synthetic Correlated Diffusion Imaging [66.63200823918429]
深層学習モデルを用いた乳癌に対する臨床支援の強化について検討した。
我々は、体積畳み込みニューラルネットワークを利用して、前処理コホートから深い放射能特徴を学習する。
提案手法は, グレードと処理後応答予測の両方において, より良い性能を実現することができる。
論文 参考訳(メタデータ) (2022-11-10T03:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。