論文の概要: Adverse Event Extraction from Discharge Summaries: A New Dataset, Annotation Scheme, and Initial Findings
- arxiv url: http://arxiv.org/abs/2506.14900v1
- Date: Tue, 17 Jun 2025 18:13:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.446461
- Title: Adverse Event Extraction from Discharge Summaries: A New Dataset, Annotation Scheme, and Initial Findings
- Title(参考訳): 放電補助装置からの逆イベント抽出:新しいデータセット、アノテーションスキーム、初期発見
- Authors: Imane Guellil, Salomé Andres, Atul Anand, Bruce Guthrie, Huayu Zhang, Abul Hasan, Honghan Wu, Beatrice Alex,
- Abstract要約: 高齢者の退院サマリーからの逆イベント(AE)抽出のための手動注釈コーパスを提案する。
このデータセットは、フォール、デリリウム、頭蓋内出血など14の臨床的に重要なAEsを含む。
3つのアノテーションの粒度にまたがってFrairNLPを用いて複数のモデルを評価する。
- 参考スコア(独自算出の注目度): 1.9036581654832787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present a manually annotated corpus for Adverse Event (AE) extraction from discharge summaries of elderly patients, a population often underrepresented in clinical NLP resources. The dataset includes 14 clinically significant AEs-such as falls, delirium, and intracranial haemorrhage, along with contextual attributes like negation, diagnosis type, and in-hospital occurrence. Uniquely, the annotation schema supports both discontinuous and overlapping entities, addressing challenges rarely tackled in prior work. We evaluate multiple models using FlairNLP across three annotation granularities: fine-grained, coarse-grained, and coarse-grained with negation. While transformer-based models (e.g., BERT-cased) achieve strong performance on document-level coarse-grained extraction (F1 = 0.943), performance drops notably for fine-grained entity-level tasks (e.g., F1 = 0.675), particularly for rare events and complex attributes. These results demonstrate that despite high-level scores, significant challenges remain in detecting underrepresented AEs and capturing nuanced clinical language. Developed within a Trusted Research Environment (TRE), the dataset is available upon request via DataLoch and serves as a robust benchmark for evaluating AE extraction methods and supporting future cross-dataset generalisation.
- Abstract(参考訳): 本研究は,高齢者の退院サマリーからの逆イベント(AE)抽出のための手動注釈コーパスを提示する。
このデータセットは、フォール、デリリウム、頭蓋内出血などの臨床上重要なAEs-14と、否定、診断タイプ、院内発生などの文脈特性を含む。
ユニークなのは、アノテーションスキーマは不連続なエンティティと重複するエンティティの両方をサポートし、以前の作業で取り組まれることの少ない課題に対処する。
本研究では,FrairNLPを用いて3つのアノテーションの粒度(細粒度,粗粒度,粗粒度)にまたがって複数のモデルを評価した。
変換器ベースのモデル(例:BERT-cased)は、文書レベルの粗粒度抽出(F1 = 0.943)において高いパフォーマンスを達成するが、特に細粒度エンティティレベルのタスク(例:F1 = 0.675)では、特に稀なイベントや複雑な属性に対してパフォーマンスが低下する。
これらの結果から, 高得点にもかかわらず, 未表現のAEの検出や, ニュアンスのある臨床用語の取得には大きな課題が残っていることが示唆された。
Trusted Research Environment (TRE)内で開発されたデータセットは、DataLoch経由で要求に応じて利用可能であり、AE抽出メソッドの評価と将来のクロスデータセットの一般化をサポートするための堅牢なベンチマークとして機能する。
関連論文リスト
- Deep evolving semi-supervised anomaly detection [14.027613461156864]
本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。
本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文 参考訳(メタデータ) (2024-12-01T15:48:37Z) - Progressive Generalization Risk Reduction for Data-Efficient Causal Effect Estimation [30.49865329385806]
因果効果推定(英: Causal effect Estimation、CEE)は、エンティティの観測されていない反事実結果を予測する重要なツールである。
本稿では,ラベル付きデータサンプルが最初から不足している,より現実的なCEE設定について検討する。
バッチワイズラベル取得のためのモデルアグノスティック因果アクティブラーニング(MACAL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-18T03:17:40Z) - CARE: Extracting Experimental Findings From Clinical Literature [29.763929941107616]
本研究は,臨床所見抽出のための新しいIEデータセットであるCAREを提示する。
我々は,エンティティと属性間のn-ary関係として微細な発見をキャプチャする新しいアノテーションスキーマを開発した。
臨床治験と症例報告の2つの資料から,700件の要約の広範な注釈を収集した。
論文 参考訳(メタデータ) (2023-11-16T10:06:19Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - DICE: Data-Efficient Clinical Event Extraction with Generative Models [93.49354508621232]
臨床領域のイベント抽出は、未調査の研究領域である。
臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能について実験を行った。
論文 参考訳(メタデータ) (2022-08-16T23:12:04Z) - NADE: A Benchmark for Robust Adverse Drug Events Extraction in Face of
Negations [8.380439657099906]
逆薬物イベント (ADE) 抽出法は, いわゆるメディアテキストの大量収集を迅速に調査し, 薬物関連副作用の言及を検知し, 医学的調査を誘発する。
近年のNLPのアドバンスにもかかわらず、そのようなモデルが言語品種にまたがって普及する傾向にあるにもかかわらず、そのようなモデルが頑丈であるかどうかは現在不明である。
本稿では,3つの最先端システムの評価を行い,ネガイオンに対する脆弱性を示すとともに,これらのモジュールの堅牢性を高めるための2つのストラテジーを提案する。
論文 参考訳(メタデータ) (2021-09-21T10:33:29Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。