論文の概要: Balancing Natural Language Processing Accuracy and Normalisation in Extracting Medical Insights
- arxiv url: http://arxiv.org/abs/2511.15778v1
- Date: Wed, 19 Nov 2025 18:51:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.330717
- Title: Balancing Natural Language Processing Accuracy and Normalisation in Extracting Medical Insights
- Title(参考訳): 医学的洞察の抽出における自然言語処理精度と正規化のバランス
- Authors: Paulina Tworek, Miłosz Bargieł, Yousef Khan, Tomasz Pełech-Pilichowski, Marek Mikołajczyk, Roman Lewandowski, Jose Sousa,
- Abstract要約: 本研究は,電子カルテからの情報抽出のためのNLP低スループットルールベース手法とLarge Language Models(LLMs)の比較分析を行った。
本研究は, テキスト正規化の欠如と翻訳による情報損失の影響について検討しながら, 患者集団, 臨床所見, 処方薬を抽出し, 双方のアプローチを評価した。
その結果、ルールに基づく手法は、特に年齢や性別の抽出において、情報検索タスクにおいて高い精度を提供することが示された。
LLMは、薬名認識に優れた適応性とスケーラビリティを提供する。
- 参考スコア(独自算出の注目度): 2.654416335526196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting structured medical insights from unstructured clinical text using Natural Language Processing (NLP) remains an open challenge in healthcare, particularly in non-English contexts where resources are scarce. This study presents a comparative analysis of NLP low-compute rule-based methods and Large Language Models (LLMs) for information extraction from electronic health records (EHR) obtained from the Voivodeship Rehabilitation Hospital for Children in Ameryka, Poland. We evaluate both approaches by extracting patient demographics, clinical findings, and prescribed medications while examining the effects of lack of text normalisation and translation-induced information loss. Results demonstrate that rule-based methods provide higher accuracy in information retrieval tasks, particularly for age and sex extraction. However, LLMs offer greater adaptability and scalability, excelling in drug name recognition. The effectiveness of the LLMs was compared with texts originally in Polish and those translated into English, assessing the impact of translation. These findings highlight the trade-offs between accuracy, normalisation, and computational cost when deploying NLP in healthcare settings. We argue for hybrid approaches that combine the precision of rule-based systems with the adaptability of LLMs, offering a practical path toward more reliable and resource-efficient clinical NLP in real-world hospitals.
- Abstract(参考訳): 自然言語処理(NLP)を用いて、構造化されていない臨床テキストから構造化された医学的洞察を抽出することは、特に資源が不足している非英語の文脈において、医療においてオープンな課題である。
本研究は,ポーランドのアメリカ市にある小児リハビリテーション病院で得られた電子健康記録(EHR)からの情報抽出のための,NLP低スループットルールベース手法とLarge Language Models(LLMs)の比較分析を行った。
本研究は, テキスト正規化の欠如と翻訳による情報損失の影響について検討しながら, 患者集団, 臨床所見, 処方薬を抽出し, 双方のアプローチを評価した。
その結果、ルールに基づく手法は、特に年齢や性別の抽出において、情報検索タスクにおいて高い精度を提供することが示された。
しかし、LSMは適応性とスケーラビリティが向上し、薬名認識に優れる。
LLMの有効性は、元々ポーランド語で書かれたテキストと英語に翻訳されたテキストと比較され、翻訳の影響を評価した。
これらの結果は、医療環境にNLPをデプロイする際の正確性、正規化、計算コストのトレードオフを浮き彫りにしている。
我々は,ルールベースシステムの精度とLLMの適応性を組み合わせるハイブリッドアプローチについて論じ,現実の病院におけるより信頼性が高く,資源効率のよい臨床NLPへの実践的な道筋を提供する。
関連論文リスト
- Fine-grained Alignment of Large Language Models for General Medication Recommendation without Overprescription [45.41664696802343]
大規模言語モデル(LLM)は、一般的な医薬品推奨システムを達成する上で大きな可能性を秘めている。
本稿では,Language-Assisted Medication Recommendationを紹介する。
このフレームワークによる微調整 LLM は、内部バリデーションの10%以上を上回り、時間的および外部バリデーションをまたいで一般化することができる。
論文 参考訳(メタデータ) (2025-03-05T17:28:16Z) - Bridging Language Barriers in Healthcare: A Study on Arabic LLMs [1.2006896500048552]
本稿では,多言語理解と医学知識の両方に熟練した大規模言語モデルを開発する上での課題について考察する。
言語比率を慎重に調整した大規模モデルは、母国語の臨床課題において優れた性能を発揮することが判明した。
論文 参考訳(メタデータ) (2025-01-16T20:24:56Z) - Evaluating Computational Accuracy of Large Language Models in Numerical Reasoning Tasks for Healthcare Applications [0.0]
医療分野で大きな言語モデル(LLM)が変革的なツールとして登場した。
数値推論の習熟度、特に臨床応用のような高い評価の領域では、未解明のままである。
本研究では,医療現場における数値推論作業におけるLCMの計算精度について検討した。
論文 参考訳(メタデータ) (2025-01-14T04:29:43Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - FactPICO: Factuality Evaluation for Plain Language Summarization of Medical Evidence [46.71469172542448]
本稿では,医療用テキストのプレーン言語要約のためのファクトPICOを提案する。
3つのランダム化制御試験(RCT)から生成される抽象語の345のプレーン言語要約で構成されている。
本研究は,これらのサマリーにおけるRCTの重要要素の事実と,それらに関する報告された知見について評価する。
論文 参考訳(メタデータ) (2024-02-18T04:45:01Z) - Natural Language Programming in Medicine: Administering Evidence Based Clinical Workflows with Autonomous Agents Powered by Generative Large Language Models [29.05425041393475]
ジェネレーティブ・大型言語モデル(LLM)は医療において大きな可能性を秘めている。
本研究は, シミュレーション3次医療センターにおいて, 自律型エージェントとして機能するLSMの可能性を評価した。
論文 参考訳(メタデータ) (2024-01-05T15:09:57Z) - LLMs Accelerate Annotation for Medical Information Extraction [7.743388571513413]
本稿では,LLM(Large Language Models)と人間の専門知識を組み合わせた手法を提案する。
医療情報抽出タスクにおいて,我々の手法を厳格に評価し,我々のアプローチが人的介入を大幅に削減するだけでなく,高い精度を維持していることを示す。
論文 参考訳(メタデータ) (2023-12-04T19:26:13Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。