論文の概要: Toward Automatic Filling of Case Report Forms: A Case Study on Data from an Italian Emergency Department
- arxiv url: http://arxiv.org/abs/2602.23062v1
- Date: Thu, 26 Feb 2026 14:49:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.728468
- Title: Toward Automatic Filling of Case Report Forms: A Case Study on Data from an Italian Emergency Department
- Title(参考訳): 事例報告書の自動記入に向けて:イタリア救急省のデータを事例として
- Authors: Gabriela Anna Kaczmarek, Pietro Ferrazzi, Lorenzo Porta, Vicky Rubini, Bernardo Magnini,
- Abstract要約: 症例報告フォーム(CRF)は、患者のデータを収集し、臨床現場で研究を行うための確立したプラクティスの中核にある。
近年の言語技術の発展に伴い,臨床ノートからの自動CRF充満への関心が高まっている。
そこで本研究では,134項目を含むCRFに注釈を付した新たな臨床用ノートのデータセットを提案する。
- 参考スコア(独自算出の注目度): 0.8851872611110546
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Case Report Forms (CRFs) collect data about patients and are at the core of well-established practices to conduct research in clinical settings. With the recent progress of language technologies, there is an increasing interest in automatic CRF-filling from clinical notes, mostly based on the use of Large Language Models (LLMs). However, there is a general scarcity of annotated CRF data, both for training and testing LLMs, which limits the progress on this task. As a step in the direction of providing such data, we present a new dataset of clinical notes from an Italian Emergency Department annotated with respect to a pre-defined CRF containing 134 items to be filled. We provide an analysis of the data, define the CRF-filling task and metric for its evaluation, and report on pilot experiments where we use an open-source state-of-the-art LLM to automatically execute the task. Results of the case-study show that (i) CRF-filling from real clinical notes in Italian can be approached in a zero-shot setting; (ii) LLMs' results are affected by biases (e.g., a cautious behaviour favours "unknown" answers), which need to be corrected.
- Abstract(参考訳): 症例報告フォーム(CRF)は、患者のデータを収集し、臨床現場で研究を行うための確立したプラクティスの中核にある。
近年の言語技術の進歩に伴い、臨床ノートからの自動CRF充満への関心が高まっており、主にLarge Language Models (LLMs) の利用に基づいている。
しかし、LDMのトレーニングとテストの双方において、注釈付きCRFデータが不足しているため、この作業の進捗が制限されている。
このようなデータ提供の方向へのステップとして,充足すべき134項目を含む予め定義されたCRFに対して,イタリア救急省が注釈を付した新たな臨床ノートのデータセットを提示する。
我々は、そのデータを分析し、その評価のためにCRF充足タスクとメートル法を定義し、オープンソースのLCMを用いてタスクを自動実行するパイロット実験について報告する。
ケーススタディの結果
一 イタリアにおける実際の臨床ノートからのCRF充填は、ゼロショット設定で行うことができる。
(ii) LLMの結果はバイアス(例えば、慎重な行動は「未知の」答えを好む)に影響され、修正する必要がある。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Harnessing Large Language Models for Precision Querying and Retrieval-Augmented Knowledge Extraction in Clinical Data Science [3.4325249294405555]
本研究では,2つの基礎的電子健康記録(EHR)データサイエンスタスクに対して,Large Language Models (LLMs)を適用した。
我々は、LLMが分析のための大規模な構造化データセットと正確に相互作用する能力をテストする。
本稿では,各データセットやタスクの特徴に合わせて,合成質問と解答ペアを自動生成するフレキシブルな評価フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-28T14:57:36Z) - Converting Annotated Clinical Cases into Structured Case Report Forms [3.5912245880418125]
ケースレポートフォーム(CRF)は、臨床研究における結果の正確性、信頼性、妥当性を保証するため、主に医学研究で使用される。
本稿では,2言語でE3Cデータセットに適用した半自動変換手法を提案する。
我々は,スロットフィリングがイタリア語で59.7%,英語で67.3%に達することを報告している。
論文 参考訳(メタデータ) (2025-06-13T10:53:50Z) - CaseReportBench: An LLM Benchmark Dataset for Dense Information Extraction in Clinical Case Reports [4.477840500181267]
IEMに着目したケースレポートの高密度情報抽出のためのエキスパートアノテートデータセットであるCaseReportBenchを紹介する。
我々は、カテゴリ固有のプロンプトやサブヘッダーによるデータ統合のような新しいアプローチを導入し、様々なモデルとプロンプト戦略を評価する。
臨床評価の結果,LSMは症例報告から臨床的に関連性のある詳細を抽出し,稀な疾患の診断と管理を支援することが示唆された。
論文 参考訳(メタデータ) (2025-05-22T20:21:32Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。