論文の概要: Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models
- arxiv url: http://arxiv.org/abs/2603.09638v2
- Date: Wed, 11 Mar 2026 08:57:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 14:12:44.358617
- Title: Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models
- Title(参考訳): テキストによるがんの追跡:オープンソースの大言語モデルを用いた放射線学報告からの縦断的抽出
- Authors: Luc Builtjes, Alessa Hering,
- Abstract要約: 完全オープンソースでローカルにデプロイ可能なパイプラインを,放射線学報告からの縦方向情報抽出のために提案する。
対象病変が93.7%,非ターゲット病変が94.9%,新しい病変が94.0%であった。
- 参考スコア(独自算出の注目度): 0.6642706656153227
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Radiology reports capture crucial longitudinal information on tumor burden, treatment response, and disease progression, yet their unstructured narrative format complicates automated analysis. While large language models (LLMs) have advanced clinical text processing, most state-of-the-art systems remain proprietary, limiting their applicability in privacy-sensitive healthcare environments. We present a fully open-source, locally deployable pipeline for longitudinal information extraction from radiology reports, implemented using the llm_extractinator framework. The system applies the qwen2.5-72b model to extract and link target, non-target, and new lesion data across time points in accordance with RECIST criteria. Evaluation on 50 Dutch CT Thorax/Abdomen report pairs yielded high extraction performance, with attribute-level accuracies of 93.7% for target lesions, 94.9% for non-target lesions, and 94.0% for new lesions. The approach demonstrates that open-source LLMs can achieve clinically meaningful performance in multi-timepoint oncology tasks while ensuring data privacy and reproducibility. These results highlight the potential of locally deployable LLMs for scalable extraction of structured longitudinal data from routine clinical text.
- Abstract(参考訳): 放射線診断では, 腫瘍の負担, 治療反応, 疾患進行に関する重要な経時的情報を取得するが, 構造的でない物語形式は自動解析を複雑にしている。
大きな言語モデル(LLM)は高度な臨床テキスト処理を備えているが、ほとんどの最先端システムはプロプライエタリであり、プライバシに敏感な医療環境において適用性を制限する。
我々は, llm_extractinatorフレームワークを用いて実装した, 放射線学レポートから縦方向の情報抽出のための, 完全オープンソースでローカルにデプロイ可能なパイプラインを提案する。
このシステムは、RECIST基準に従って、ターゲット、非ターゲット、および新しい病変データを抽出、リンクするためにqwen2.5-72bモデルを適用している。
対象病変が93.7%,非ターゲット病変が94.9%,新しい病変が94.0%であった。
このアプローチは、オープンソースのLCMが、データのプライバシと再現性を確保しながら、マルチタイムポイントオンコロジータスクにおいて臨床的に有意義なパフォーマンスを達成できることを実証する。
これらの結果は, 日常的な臨床テキストから構造化長手データをスケーラブルに抽出するために, 局所展開可能なLCMの可能性を浮き彫りにした。
関連論文リスト
- Standardizing Longitudinal Radiology Report Evaluation via Large Language Model Annotation [10.771534459008699]
放射線学報告における縦断的な情報は、時間とともに複数の検査にまたがる結果のシーケンシャルな追跡を指す。
基盤構造とモデル生成の両テキストの時間的変化を一貫してラベル付けする適切なツールは存在しない。
既存のアノテーションメソッドは、通常労働集約的であり、手動のレキシコンとルールの使用に依存している。
論文 参考訳(メタデータ) (2026-01-23T13:57:09Z) - Leveraging large language models for structured information extraction from pathology reports [0.0]
乳がん病理組織学的報告から構造情報を抽出する際の大規模言語モデルの精度を評価する。
構造化情報抽出のためのオープンソースツールは、自然言語を使って非プログラマがカスタマイズできる。
論文 参考訳(メタデータ) (2025-02-14T21:46:02Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - Improving Radiology Report Conciseness and Structure via Local Large Language Models [0.0]
放射線医学の報告は長大で非構造的であり、医師を参照する上での課題である。
この振り返り研究は、簡潔でよく構造化された放射線学レポートを強化することを目的としていた。
論文 参考訳(メタデータ) (2024-11-06T19:00:57Z) - Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports [2.932283627137903]
この研究は、2つのデータセットを利用していた:7,294の放射線診断報告は、BT-RADS(Brain tumor Reporting and Data System)スコアに注釈付けされ、2,154の病理診断報告は、isocitrate dehydrogenase(IDH)変異のステータスに注釈付けされた。
論文 参考訳(メタデータ) (2024-09-15T15:21:45Z) - Automated Labeling of German Chest X-Ray Radiology Reports using Deep
Learning [50.591267188664666]
本稿では,ルールベースのドイツ語CheXpertモデルによってラベル付けされたレポートに基づいて,ディープラーニングに基づくCheXpertラベル予測モデルを提案する。
その結果,3つのタスクすべてにおいて,ルールベースモデルを大幅に上回ったアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-06-09T16:08:35Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。