論文の概要: Extracting Breast Cancer Phenotypes from Clinical Notes: Comparing LLMs with Classical Ontology Methods
- arxiv url: http://arxiv.org/abs/2604.06208v1
- Date: Mon, 16 Mar 2026 05:09:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.63708
- Title: Extracting Breast Cancer Phenotypes from Clinical Notes: Comparing LLMs with Classical Ontology Methods
- Title(参考訳): LLMと古典的オントロジー法の比較
- Authors: Abdullah Bin Faiz, Arbaz Khan Shehzad, Asad Afzal, Momin Tariq, Muhammad Siddiqi, Muhammad Usamah Shahid, Maryam Noor Awan, Muddassar Farooq,
- Abstract要約: オンコロジー・エレクトロニック・メディカル・レコード(EMR)に保持される膨大な量のデータは、構造化されていない提供者ノートに含まれている。
臨床研究によると、ほとんどの腫瘍学者は、これらの貴重な知見を自然言語で得られることに満足している。
この研究の主な貢献は、プロバイダノートを処理し、貴重な医療知識と表現型を抽出するLLMベースのフレームワークを報告することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A significant amount of data held in Oncology Electronic Medical Records (EMRs) is contained in unstructured provider notes -- including but not limited to the chemotherapy (or cancer treatment) outcome, different biomarkers, the tumor's location, sizes, and growth patterns of a patient. The clinical studies show that the majority of oncologists are comfortable providing these valuable insights in their notes in a natural language rather than the relevant structured fields of an EMR. The major contribution of this research is to report an LLM-based framework to process provider notes and extract valuable medical knowledge and phenotype mentioned above, with a focus on the domain of oncology. In this paper, we focus on extracting phenotypes related to breast cancer using our LLM framework, and then compare its performance with earlier works that used knowledge-driven annotation system, paired with the NCIt Ontology Annotator. The results of the study show that an LLM-based information extraction framework can be easily adapted to extract phenotypes with an accuracy that is comparable to the classical ontology-based methods. However, once trained, they could be easily fine-tuned to cater for other cancer types and diseases.
- Abstract(参考訳): オンコロジー・エレクトロニック・メディカル・レコード (Oncology Electronic Medical Records, EMRs) に保持されている大量のデータは、化学療法(またはがん治療)の結果、異なるバイオマーカー、腫瘍の位置、サイズ、成長パターンなど、構造化されていない提供者ノートに含まれている。
臨床研究によると、腫瘍学者の大多数は、EMRの関連した構造的な分野ではなく、自然言語でこれらの貴重な知見を提供するのが快適である。
この研究の主な貢献は、先述した貴重な医療知識と表現型を処理・抽出するためのLCMベースのフレームワークを報告し、オンコロジーの領域に焦点をあてることである。
本稿では, LLMフレームワークを用いて乳癌に関連する表現型を抽出することに着目し, NCIt Ontology Annotatorと組み合わせた知識駆動アノテーションシステムを用いた先行研究と比較する。
その結果,LPMに基づく情報抽出フレームワークは,従来のオントロジー法に匹敵する精度で表現型を容易に抽出できることがわかった。
しかし、一度訓練すれば、他の種類のがんや病気を治療するために簡単に微調整できる。
関連論文リスト
- TSEML: A task-specific embedding-based method for few-shot classification of cancer molecular subtypes [4.815808233338459]
異種および小癌のデータセットにおける数発の分子サブタイプ予測問題に焦点をあてる。
タスク固有の埋め込み型メタラーニングフレームワーク(TSEML)を導入する。
本フレームワークは,数発の分子サブタイプ分類の問題に対処する上で,優れた性能を実現する。
論文 参考訳(メタデータ) (2024-12-17T11:30:54Z) - Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - LLMs in Biomedicine: A study on clinical Named Entity Recognition [42.71263594812782]
大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な汎用性を示す。
本稿では,NERタスクの性能向上戦略について検討する。
提案手法であるDiRAGは,バイオメディカルNERにおけるLDMのゼロショットF1スコアを高めることができる。
論文 参考訳(メタデータ) (2024-04-10T22:26:26Z) - Beyond attention: deriving biologically interpretable insights from
weakly-supervised multiple-instance learning models [2.639541396835675]
本稿では,高精細エンコーダによるタイルレベルのアテンションと予測スコアを組み合わせたPAWマップを提案する。
また, PAWマップと核分割マスクを統合することにより, 生物学的特徴のインスタンス化手法も導入する。
本手法により, 予後不良の予知を行う領域は, 腫瘍部位と同一位置にあることが判明した。
論文 参考訳(メタデータ) (2023-09-07T09:44:35Z) - MoCLIM: Towards Accurate Cancer Subtyping via Multi-Omics Contrastive
Learning with Omics-Inference Modeling [9.900594964709116]
我々は癌サブタイプのための表現学習フレームワークであるMoCLIMを開発した。
その結果,本手法は,高次元癌症例の少ない症例において,データ適合性やサブタイプ性能を著しく向上させることが示唆された。
本フレームワークは, 各種医療評価を最終要素として含み, 医療分析における高い解釈可能性を提供する。
論文 参考訳(メタデータ) (2023-08-17T10:49:48Z) - Cross-Lingual Knowledge Transfer for Clinical Phenotyping [55.92262310716537]
本稿では,英語を使わないクリニックに対して,このタスクを実行するための言語間知識伝達戦略について検討する。
ギリシャ語とスペイン語のクリニックに対して,異なる臨床領域のクリニカルノートを活用して,これらの戦略を評価する。
以上の結果から,多言語データを用いることで,臨床表現型モデルが改善され,データの疎度を補うことが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-08-03T08:33:21Z) - Weakly supervised multiple instance learning histopathological tumor
segmentation [51.085268272912415]
スライド画像全体のセグメント化のための弱教師付きフレームワークを提案する。
トレーニングモデルに複数のインスタンス学習スキームを利用する。
提案するフレームワークは,The Cancer Genome AtlasとPatchCamelyonデータセットのマルチロケーションとマルチ中心公開データに基づいて評価されている。
論文 参考訳(メタデータ) (2020-04-10T13:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。