論文の概要: Can Large Language Models Reliably Extract Physiology Index Values from Coronary Angiography Reports?
- arxiv url: http://arxiv.org/abs/2604.13077v1
- Date: Sat, 21 Mar 2026 01:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.665868
- Title: Can Large Language Models Reliably Extract Physiology Index Values from Coronary Angiography Reports?
- Title(参考訳): 大言語モデルでは冠動脈造影所見から生理指標を確実に抽出できるか?
- Authors: Sofia Morgado, Filipa Valdeira, Niklas Sander, Diogo Ferreira, Marta Vilela, Miguel Menezes, Cláudia Soares,
- Abstract要約: 本研究はCAG報告の大規模コーパス(1342件)から抽出された生理指標に初めて対応したものである。
測定の幅を考慮し、フォーマットの妥当性、値検出、値の正しさを分離する多段階評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.1061680331694044
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coronary angiography (CAG) reports contain clinically relevant physiological measurements, yet this information is typically in the form of unstructured natural language, limiting its use in research. We investigate the use of Large Language Models (LLMs) to automatically extract these values, along with their anatomical locations, from Portuguese CAG reports. To our knowledge, this study is the first addressing physiology indexes extraction from a large (1342 reports) corpus of CAG reports, and one of the few focusing on CAG or Portuguese clinical text. We explore local privacy-preserving general-purpose and medical LLMs under different settings. Prompting strategies included zero-shot, few-shot, and few-shot prompting with implausible examples. In addition, we apply constrained generation and introduce a post-processing step based on RegEx. Given the sparsity of measurements, we propose a multi-stage evaluation framework separating format validity, value detection, and value correctness, while accounting for asymmetric clinical error costs. This study demonstrates the potential of LLMs in for extracting physiological indices from Portuguese CAG reports. Non-medical models performed similarly, the best results were obtained with Llama with a zero-shot prompting, while GPT-OSS demonstrated the highest robustness to changes in the prompts. While MedGemma demonstrated similar results to non-medical models, MedLlama's results were out-of-format in the unconstrained setting, and had a significant lower performance in the constrained one. Changes in the prompt techinique and adding a RegEx layer showed no significant improvement across models, while using constrained generation decreased performance, although having the benefit of allowing the usage of specific models that are not able to conform with the templates.
- Abstract(参考訳): 冠動脈造影(CAG)報告は臨床的に関連のある生理的測定を含んでいるが、この情報は典型的には非構造化自然言語の形で、研究での使用を制限する。
ポルトガルのCAGレポートから,これらの値と解剖学的位置を自動的に抽出するLarge Language Models (LLMs) について検討した。
本研究は,CAG報告の大規模コーパス (1342件) から抽出された生理指標に初めて対応し,CAGやポルトガルの臨床文献に焦点をあてた数少ない事例の1つである。
ローカルなプライバシ保護のための汎用LLMと医療用LLMを異なる設定で検討する。
プロンプティングの戦略には、ゼロショット、少数ショット、そして数ショットのプロンプトが含まれていた。
また、制約付き生成を適用し、RegExに基づく後処理のステップを導入する。
そこで本研究では,非対称な臨床的エラーコストを考慮しつつ,フォーマットの妥当性,値検出,値の正しさを分離した多段階評価フレームワークを提案する。
本研究は,ポルトガルのCAGレポートから生理指標抽出におけるLCMの有用性を示すものである。
非医療モデルも同様に、ゼロショットプロンプトによるLlamaによる最良の結果が得られたが、GPT-OSSはプロンプトの変化に対して最も堅牢であることを示した。
MedGemma は非医療モデルと同様の結果を示したが、MedLlama の結果は制約のない環境では役に立たず、制約されたモデルでは性能が著しく低下した。
プロンプト技術の変更とRegExレイヤの追加は、モデル間で大きな改善はないが、制約付き生成を使用することでパフォーマンスが低下した。
関連論文リスト
- Evaluating Open-Weight Large Language Models for Structured Data Extraction from Narrative Medical Reports Across Multiple Use Cases and Languages [2.3429123017483016]
大規模言語モデル (LLMs) は、自由テキスト臨床記録から構造化された情報を抽出するためにますます使われている。
当科では6症例に15例のオープンウェイトLSMを報告した。
論文 参考訳(メタデータ) (2025-11-03T12:32:01Z) - Specialised or Generic? Tokenization Choices for Radiology Language Models [2.081299660192454]
言語モデル(LM)が使用する語彙は、テキスト生成の品質において重要な役割を果たす。
放射線診断のタスクにおける一般,医療,ドメイン特異的なトークン化剤は,3つの画像モダリティにまたがって要約を報告する。
以上の結果から, 医学的, 専門的な語彙は, モデルがゼロから訓練されたとき, 広く使われている自然言語の代替語よりも優れていた。
論文 参考訳(メタデータ) (2025-08-13T17:13:56Z) - Extracting Patient History from Clinical Text: A Comparative Study of Clinical Large Language Models [3.1277841304339065]
本研究は,臨床大言語モデル(cLLMs)の医療史エンティティ(MHEs)認識における性能評価である。
MTSamplesレポジトリから61例の外来臨床ノートに1,449例の診断を行った。
cLLMsはMHEの抽出に要する時間を20%以上短縮する可能性を示した。
論文 参考訳(メタデータ) (2025-03-30T02:00:56Z) - Classification of Radiological Text in Small and Imbalanced Datasets in a Non-English Language [8.93554009307115]
自然言語処理は、非英語の小さなデータセットを含む現実世界のアプリケーションでは性能が劣る可能性がある。
BERT-like transformer, few-shot learning with sentence transformer (SetFit) などのNLPモデルのセットを評価し,大規模言語モデル (LLM) を誘導した。
以上の結果から,放射線学報告の対象領域で事前訓練されたBERT様モデルでは,このシナリオに最適な性能が得られることが示唆された。
論文 参考訳(メタデータ) (2024-09-30T09:52:28Z) - Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports [2.932283627137903]
この研究は、2つのデータセットを利用していた:7,294の放射線診断報告は、BT-RADS(Brain tumor Reporting and Data System)スコアに注釈付けされ、2,154の病理診断報告は、isocitrate dehydrogenase(IDH)変異のステータスに注釈付けされた。
論文 参考訳(メタデータ) (2024-09-15T15:21:45Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。