論文の概要: Summarizing Patients Problems from Hospital Progress Notes Using
Pre-trained Sequence-to-Sequence Models
- arxiv url: http://arxiv.org/abs/2208.08408v1
- Date: Wed, 17 Aug 2022 17:07:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-18 12:15:28.209541
- Title: Summarizing Patients Problems from Hospital Progress Notes Using
Pre-trained Sequence-to-Sequence Models
- Title(参考訳): プレトレーニングシーケンス・ツー・シークエンスモデルを用いた病院進行ノートからの患者問題の要約
- Authors: Yanjun Gao, Dmitry Dligach, Timothy Miller, Dongfang Xu, Matthew M.
Churpek, Majid Afshar
- Abstract要約: 問題リストの要約には、臨床文書を理解し、抽象化し、生成するモデルが必要である。
当科では,入院時に提供者の進捗記録からの入力を用いて,患者の日常診療計画における問題点のリストを作成することを目的とした,新たなNLPタスクを提案する。
- 参考スコア(独自算出の注目度): 9.879960506853145
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automatically summarizing patients' main problems from daily progress notes
using natural language processing methods helps to battle against information
and cognitive overload in hospital settings and potentially assists providers
with computerized diagnostic decision support. Problem list summarization
requires a model to understand, abstract, and generate clinical documentation.
In this work, we propose a new NLP task that aims to generate a list of
problems in a patient's daily care plan using input from the provider's
progress notes during hospitalization. We investigate the performance of T5 and
BART, two state-of-the-art seq2seq transformer architectures, in solving this
problem. We provide a corpus built on top of progress notes from publicly
available electronic health record progress notes in the Medical Information
Mart for Intensive Care (MIMIC)-III. T5 and BART are trained on general domain
text, and we experiment with a data augmentation method and a domain adaptation
pre-training method to increase exposure to medical vocabulary and knowledge.
Evaluation methods include ROUGE, BERTScore, cosine similarity on sentence
embedding, and F-score on medical concepts. Results show that T5 with domain
adaptive pre-training achieves significant performance gains compared to a
rule-based system and general domain pre-trained language models, indicating a
promising direction for tackling the problem summarization task.
- Abstract(参考訳): 自然言語処理手法を用いて患者の主要な問題を日々の進捗ノートから自動的に要約することは、病院設定における情報や認知的過負荷と戦うのに役立つ。
問題リストの要約には、臨床文書を理解し、抽象化し、生成するモデルが必要である。
本研究は,入院時に提供者の進捗記録からの入力を用いて,患者の日常ケア計画における課題リストを作成することを目的とした,新たなNLPタスクを提案する。
本稿では,T5とBARTの2つの最先端セq2seqトランスアーキテクチャの性能について検討する。
我々は,MIMIC(Message Information Mart for Intensive Care)-IIIで公開されている電子健康記録の進歩ノートの進捗ノートの上に構築されたコーパスを提供する。
T5とBARTは、一般的なドメインテキストに基づいて訓練され、医療用語や知識への露出を高めるために、データ拡張法とドメイン適応事前学習法を試行する。
評価方法はROUGE、BERTScore、文章埋め込みにおけるコサイン類似性、医療概念に関するFスコアなどである。
その結果,t5はルールベースシステムや一般ドメイン事前学習言語モデルと比較して有意な性能向上を達成し,問題要約タスクに取り組むための有望な方向を示している。
関連論文リスト
- Automated Information Extraction from Thyroid Operation Narrative: A Comparative Study of GPT-4 and Fine-tuned KoELECTRA [1.137357582959183]
本研究は, GPT-4モデルと比較し, 微調整KoELECTRAモデルの変形特性に着目した。
この研究は、高度な自然言語処理(NLP)技術を活用し、より高度なデータ処理システムへのパラダイムシフトを促進する。
論文 参考訳(メタデータ) (2024-06-12T06:44:05Z) - README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.432205523734707]
医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文 参考訳(メタデータ) (2023-12-24T23:01:00Z) - PULSAR: Pre-training with Extracted Healthcare Terms for Summarising
Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。
BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。
1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。
私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文 参考訳(メタデータ) (2023-06-05T10:17:50Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Hierarchical Annotation for Building A Suite of Clinical Natural
Language Processing Tasks: Progress Note Understanding [4.5939673461957335]
本研究は,臨床テキスト理解,臨床推論,要約を行うための3段階の階層的アノテーションスキーマを導入する。
我々は,公開日誌の広範囲な収集に基づいて注釈付きコーパスを作成した。
また、3つのアノテーションステージを利用する3つのタスクで、プログレッシブノート理解という新しいタスクスイートも定義します。
論文 参考訳(メタデータ) (2022-04-06T18:38:08Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Towards an Automated SOAP Note: Classifying Utterances from Medical
Conversations [0.6875312133832078]
我々は、(i)SOAPセクションと(ii)話者の役割に従って、医療会話から発話を分類するためのギャップを橋渡しします。
本稿では,既存のディープラーニングアーキテクチャを上記の2つのタスクに適応させるシステム分析を提案する。
その結果,単語レベルと発話レベルの両方をキャプチャする階層的な文脈をモデル化することで,両者の分類作業を大幅に改善することが示唆された。
論文 参考訳(メタデータ) (2020-07-17T04:19:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。