論文の概要: Hierarchical Annotation for Building A Suite of Clinical Natural
Language Processing Tasks: Progress Note Understanding
- arxiv url: http://arxiv.org/abs/2204.03035v1
- Date: Wed, 6 Apr 2022 18:38:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 13:30:19.905102
- Title: Hierarchical Annotation for Building A Suite of Clinical Natural
Language Processing Tasks: Progress Note Understanding
- Title(参考訳): 臨床自然言語処理タスクのスイート構築のための階層的アノテーション:進歩ノート理解
- Authors: Yanjun Gao, Dmitriy Dligach, Timothy Miller, Samuel Tesch, Ryan
Laffin, Matthew M. Churpek, Majid Afshar
- Abstract要約: 本研究は,臨床テキスト理解,臨床推論,要約を行うための3段階の階層的アノテーションスキーマを導入する。
我々は,公開日誌の広範囲な収集に基づいて注釈付きコーパスを作成した。
また、3つのアノテーションステージを利用する3つのタスクで、プログレッシブノート理解という新しいタスクスイートも定義します。
- 参考スコア(独自算出の注目度): 4.5939673461957335
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Applying methods in natural language processing on electronic health records
(EHR) data is a growing field. Existing corpus and annotation focus on modeling
textual features and relation prediction. However, there is a paucity of
annotated corpus built to model clinical diagnostic thinking, a process
involving text understanding, domain knowledge abstraction and reasoning. This
work introduces a hierarchical annotation schema with three stages to address
clinical text understanding, clinical reasoning, and summarization. We created
an annotated corpus based on an extensive collection of publicly available
daily progress notes, a type of EHR documentation that is collected in time
series in a problem-oriented format. The conventional format for a progress
note follows a Subjective, Objective, Assessment and Plan heading (SOAP). We
also define a new suite of tasks, Progress Note Understanding, with three tasks
utilizing the three annotation stages. The novel suite of tasks was designed to
train and evaluate future NLP models for clinical text understanding, clinical
knowledge representation, inference, and summarization.
- Abstract(参考訳): 自然言語処理の手法を電子健康記録(EHR)データに適用することは成長分野である。
既存のコーパスとアノテーションはテキストの特徴のモデリングと関係予測に重点を置いている。
しかし、臨床診断思考をモデル化するための注釈付きコーパス、テキスト理解、ドメイン知識の抽象化、推論を含むプロセスがある。
本研究は,臨床テキスト理解,臨床推論,要約のための3段階の階層的アノテーションスキーマを導入する。
私たちは、問題指向の形式で時系列に収集される、ehrドキュメントの一種であるdaily progress notesの広範なコレクションに基づいて、注釈付きコーパスを作成しました。
進捗ノートの従来のフォーマットは、主観的、客観的、評価、計画の方向性(SOAP)に従っています。
3つのアノテーションステージを活用した,新たなタスクスイートであるprogress note understandingも定義しています。
新たなタスクスイートは、臨床テキスト理解、臨床知識表現、推論、要約のための将来のNLPモデルを訓練し、評価するために設計された。
関連論文リスト
- Improving Clinical Note Generation from Complex Doctor-Patient Conversation [20.2157016701399]
大言語モデル(LLM)を用いた臨床ノート作成分野への3つの重要な貢献について述べる。
まず、CliniKnoteを紹介します。CliniKnoteは、1200の複雑な医師と患者との会話と、その全臨床ノートを組み合わせたデータセットです。
第2に,従来のSOAPcitepodder20soap(Subjective, Objective, Assessment, Plan)のメモを上位にキーワードセクションを追加することで,必須情報の迅速な識別を可能にするK-SOAPを提案する。
第3に、医師と患者との会話からK-SOAPノートを生成する自動パイプラインを開発し、様々な近代LCMをベンチマークする。
論文 参考訳(メタデータ) (2024-08-26T18:39:31Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Summarizing Patients Problems from Hospital Progress Notes Using
Pre-trained Sequence-to-Sequence Models [9.879960506853145]
問題リストの要約には、臨床文書を理解し、抽象化し、生成するモデルが必要である。
当科では,入院時に提供者の進捗記録からの入力を用いて,患者の日常診療計画における問題点のリストを作成することを目的とした,新たなNLPタスクを提案する。
論文 参考訳(メタデータ) (2022-08-17T17:07:35Z) - A Unified Framework of Medical Information Annotation and Extraction for
Chinese Clinical Text [1.4841452489515765]
現在の最先端(SOTA)NLPモデルは、ディープラーニング技術と高度に統合されている。
本研究では,医学的実体認識,関係抽出,属性抽出の工学的枠組みを提案する。
論文 参考訳(メタデータ) (2022-03-08T03:19:16Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。