論文の概要: Generating Faithful and Complete Hospital-Course Summaries from the Electronic Health Record
- arxiv url: http://arxiv.org/abs/2404.01189v1
- Date: Mon, 1 Apr 2024 15:47:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-03 21:55:47.505329
- Title: Generating Faithful and Complete Hospital-Course Summaries from the Electronic Health Record
- Title(参考訳): 電子カルテからフル・フル・フル・ホスピタル・サマリーを創出する
- Authors: Griffin Adams,
- Abstract要約: ドキュメントの負担の増加による意図しない結果が、患者との対面時間を短縮した。
本稿では,患者の入院状況の要約を自動生成するためのソリューションを提案し,評価する。
- 参考スコア(独自算出の注目度): 3.6513957125331555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid adoption of Electronic Health Records (EHRs) has been instrumental in streamlining administrative tasks, increasing transparency, and enabling continuity of care across providers. An unintended consequence of the increased documentation burden, however, has been reduced face-time with patients and, concomitantly, a dramatic rise in clinician burnout. In this thesis, we pinpoint a particularly time-intensive, yet critical, documentation task: generating a summary of a patient's hospital admissions, and propose and evaluate automated solutions. In Chapter 2, we construct a dataset based on 109,000 hospitalizations (2M source notes) and perform exploratory analyses to motivate future work on modeling and evaluation [NAACL 2021]. In Chapter 3, we address faithfulness from a modeling perspective by revising noisy references [EMNLP 2022] and, to reduce the reliance on references, directly calibrating model outputs to metrics [ACL 2023]. These works relied heavily on automatic metrics as human annotations were limited. To fill this gap, in Chapter 4, we conduct a fine-grained expert annotation of system errors in order to meta-evaluate existing metrics and better understand task-specific issues of domain adaptation and source-summary alignments. To learn a metric less correlated to extractiveness (copy-and-paste), we derive noisy faithfulness labels from an ensemble of existing metrics and train a faithfulness classifier on these pseudo labels [MLHC 2023]. Finally, in Chapter 5, we demonstrate that fine-tuned LLMs (Mistral and Zephyr) are highly prone to entity hallucinations and cover fewer salient entities. We improve both coverage and faithfulness by performing sentence-level entity planning based on a set of pre-computed salient entities from the source text, which extends our work on entity-guided news summarization [ACL, 2023], [EMNLP, 2023].
- Abstract(参考訳): 電子健康記録(EHR)の急速な普及は、行政業務の合理化、透明性の向上、提供者間のケアの継続の実現に役立っている。
しかし、ドキュメントの負担の増加による意図しない結果が、患者との対面時間を短縮し、同時にクリニックバーンアウトの劇的な増加が見られた。
本論文では,患者の入院状況の要約を作成し,自動化ソリューションの提案と評価を行う。
第2章では,109,000件の入院(2M資料)に基づくデータセットを構築し,今後のモデリングと評価への取り組みを動機づける探索分析を行う [NAACL 2021]。
第3章では、ノイズレファレンス[EMNLP 2022]を改訂し、参照への依存を減らし、モデル出力を直接メトリクス[ACL 2023]に校正することで、モデリングの観点から忠実さを論じる。
人間のアノテーションが限られていたため、これらの作業は自動メトリクスに大きく依存した。
このギャップを埋めるために、第4章では、既存のメトリクスをメタ評価し、ドメイン適応とソース・サマリアライメントのタスク固有の問題をよりよく理解するために、システムエラーの詳細な専門家アノテーションを実行します。
抽出性(コピー・アンド・ペースト)に相関しないメトリクスを学習するために、既存のメトリクスのアンサンブルからノイズの多い忠実度ラベルを導き、これらの疑似ラベル[MLHC 2023]に忠実度分類器を訓練する。
最後に、第5章では、微調整されたLLM(ミストラルとゼファー)が、実体幻覚に強く影響し、より塩分が少ないことを実証する。
本研究では,テキストから事前計算された有能なエンティティの集合に基づいて文レベルのエンティティ計画を行うことにより,包括的・忠実性の両方を改善し,エンティティ誘導ニュース要約 [ACL, 2023], [EMNLP, 2023] の作業を拡張した。
関連論文リスト
- Optimizing Automatic Summarization of Long Clinical Records Using Dynamic Context Extension:Testing and Evaluation of the NBCE Method [1.2779169621283721]
現在の手作業による要約は、医療スタッフを苦しめる。
LLMを用いた自動手法を提案するが、長い入力によってLLMがコンテキストを失う。
7Bモデルであるopen-calm-7bをNative Bayes Context Extendで拡張しました。
改善されたモデルは、200サンプルのROUGE-Lメトリクス上で、Googleの175B Geminiとほぼ同等に達成しました。
論文 参考訳(メタデータ) (2024-11-13T13:09:14Z) - Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.325956390997]
本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文 参考訳(メタデータ) (2024-10-14T10:44:47Z) - VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.43276586087863]
LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。
既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。
対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文 参考訳(メタデータ) (2024-04-22T04:49:22Z) - FABLES: Evaluating faithfulness and content selection in book-length summarization [55.50680057160788]
本稿では,本書の忠実度と内容選択の大規模評価を行う。
LLMが生成した26冊のサマリーで作成した3,158冊の注釈のデータセットであるFABLESを5.2KUSDで収集する。
注釈の分析によると、ほとんどの不誠実な主張は出来事や登場人物の状態に関係しており、物語を無効にするために間接的推論を必要とする。
論文 参考訳(メタデータ) (2024-04-01T17:33:38Z) - SPEER: Sentence-Level Planning of Long Clinical Summaries via Embedded Entity Retrieval [9.654951710218876]
臨床医は、患者が退院するたびに、長い要約を書かなければならない。
要約が臨床的に有用であるためには、健全な実体を同定し、カバーすることが不可欠である。
我々は、そのタスクでオープンソースLLMを微調整し、不完全で不誠実な要約を生成することを発見した。
論文 参考訳(メタデータ) (2024-01-04T17:23:44Z) - CUED at ProbSum 2023: Hierarchical Ensemble of Summarization Models [8.237131071390715]
我々は,患者の医療進歩ノートを限られたデータセットで要約する上での課題について考察する。
バイオNLPワークショップ2023における課題リスト要約(Shared Task 1A)では,臨床T5の微調整による765件の診療ノートが,他の抽出的,抽象的,ゼロショットベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2023-06-08T16:08:10Z) - PULSAR: Pre-training with Extracted Healthcare Terms for Summarising
Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。
BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。
1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。
私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文 参考訳(メタデータ) (2023-06-05T10:17:50Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - A Meta-Evaluation of Faithfulness Metrics for Long-Form Hospital-Course
Summarization [2.8575516056239576]
病院入院の長期的臨床要約は、臨床医と患者の両方に役立つ可能性から、現実的な重要性を持っている。
本研究は,患者の短期病院講座のモデル作成要約に対して,人体アノテーションの微粒化に対する忠実度指標をベンチマークした。
論文 参考訳(メタデータ) (2023-03-07T14:57:06Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。