論文の概要: CLIP: A Dataset for Extracting Action Items for Physicians from Hospital
Discharge Notes
- arxiv url: http://arxiv.org/abs/2106.02524v1
- Date: Fri, 4 Jun 2021 14:49:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 15:26:38.103857
- Title: CLIP: A Dataset for Extracting Action Items for Physicians from Hospital
Discharge Notes
- Title(参考訳): CLIP:病院退院ノートから医師の行動項目を抽出するためのデータセット
- Authors: James Mullenbach, Yada Pruksachatkun, Sean Adler, Jennifer Seale,
Jordan Swartz, T. Greg McKelvey, Hui Dai, Yi Yang, David Sontag
- Abstract要約: 我々はMIMIC-III上に注釈付けされた臨床行動項目のデータセットを作成する。
このデータセットはCLIPと呼ばれ、医師によって注釈付けされ、1万の文章を表す文書をカバーしています。
本稿では,これらの文書からアクション項目を抽出するタスクを多アスペクト抽出要約として記述する。
- 参考スコア(独自算出の注目度): 17.107315598110183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continuity of care is crucial to ensuring positive health outcomes for
patients discharged from an inpatient hospital setting, and improved
information sharing can help. To share information, caregivers write discharge
notes containing action items to share with patients and their future
caregivers, but these action items are easily lost due to the lengthiness of
the documents. In this work, we describe our creation of a dataset of clinical
action items annotated over MIMIC-III, the largest publicly available dataset
of real clinical notes. This dataset, which we call CLIP, is annotated by
physicians and covers 718 documents representing 100K sentences. We describe
the task of extracting the action items from these documents as multi-aspect
extractive summarization, with each aspect representing a type of action to be
taken. We evaluate several machine learning models on this task, and show that
the best models exploit in-domain language model pre-training on 59K
unannotated documents, and incorporate context from neighboring sentences. We
also propose an approach to pre-training data selection that allows us to
explore the trade-off between size and domain-specificity of pre-training
datasets for this task.
- Abstract(参考訳): 入院病院から退院した患者の健康状態の健全性を確保するためには,ケアの継続性が不可欠であり,情報共有の改善が有効である。
情報を共有するために、介護者は、患者とその将来の介護者と共有するアクションアイテムを含む退院券を書くが、これらのアクションアイテムは、文書の長大さにより簡単に失われる。
本報告では,MIMIC-III上に注釈付き臨床行動項目のデータセットの作成について述べる。
このデータセットはCLIPと呼ばれ、医師によって注釈付けされており、100K文を表す718の文書をカバーしています。
本稿では,これらの文書からアクション項目を抽出するタスクを,対象とするアクションのタイプを表す各側面をマルチスペクトル抽出要約として記述する。
本稿では,この課題における機械学習モデルの評価を行い,59Kの未注釈文書を事前学習したドメイン内言語モデルを利用した最良のモデルを示す。
また、このタスクのために、事前トレーニングデータセットのサイズとドメイン固有性の間のトレードオフを調査できる事前トレーニングデータ選択へのアプローチを提案する。
関連論文リスト
- NOTE: Notable generation Of patient Text summaries through Efficient
approach based on direct preference optimization [0.0]
NOTE」は「直接選好最適化に基づく効率的なアプローチによる患者テキスト要約の不適切な生成」の意。
患者イベントは順次組み合わせられ、各入院の退院の概要を生成するために使用される。
ノートは、サマリーを放出するだけでなく、患者の旅行を通して様々なサマリーを生成するために利用することができる。
論文 参考訳(メタデータ) (2024-02-19T06:43:25Z) - Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。
本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。
病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T21:53:40Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - PULSAR: Pre-training with Extracted Healthcare Terms for Summarising
Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。
BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。
1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。
私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文 参考訳(メタデータ) (2023-06-05T10:17:50Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - DICE: Data-Efficient Clinical Event Extraction with Generative Models [93.49354508621232]
臨床領域のイベント抽出は、未調査の研究領域である。
臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能について実験を行った。
論文 参考訳(メタデータ) (2022-08-16T23:12:04Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Towards Clinical Encounter Summarization: Learning to Compose Discharge
Summaries from Prior Notes [15.689048077818324]
本論文では,臨床遭遇のための排出要約を生成するタスクについて紹介する。
評価には,2つの新しい尺度,忠実度と幻覚率を導入する。
7つの医療部門と5つのモデルにわたる結果は、トレーサビリティをサポートする要約アーキテクチャが有望な結果をもたらすことを示しています。
論文 参考訳(メタデータ) (2021-04-27T22:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。