論文の概要: Classifying Unstructured Clinical Notes via Automatic Weak Supervision
- arxiv url: http://arxiv.org/abs/2206.12088v1
- Date: Fri, 24 Jun 2022 05:55:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-28 00:28:16.798368
- Title: Classifying Unstructured Clinical Notes via Automatic Weak Supervision
- Title(参考訳): 自動弱視による非構造的臨床ノートの分類
- Authors: Chufan Gao, Mononito Goswami, Jieshi Chen, and Artur Dubrawski
- Abstract要約: クラスラベル記述のみから学習する、一般的な弱教師付きテキスト分類フレームワークを導入する。
我々は、事前訓練された言語モデルとデータプログラミングフレームワークに格納された言語ドメインの知識を活用して、テキストにコードラベルを割り当てる。
- 参考スコア(独自算出の注目度): 17.45660355026785
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Healthcare providers usually record detailed notes of the clinical care
delivered to each patient for clinical, research, and billing purposes. Due to
the unstructured nature of these narratives, providers employ dedicated staff
to assign diagnostic codes to patients' diagnoses using the International
Classification of Diseases (ICD) coding system. This manual process is not only
time-consuming but also costly and error-prone. Prior work demonstrated
potential utility of Machine Learning (ML) methodology in automating this
process, but it has relied on large quantities of manually labeled data to
train the models. Additionally, diagnostic coding systems evolve with time,
which makes traditional supervised learning strategies unable to generalize
beyond local applications. In this work, we introduce a general
weakly-supervised text classification framework that learns from class-label
descriptions only, without the need to use any human-labeled documents. It
leverages the linguistic domain knowledge stored within pre-trained language
models and the data programming framework to assign code labels to individual
texts. We demonstrate the efficacy and flexibility of our method by comparing
it to state-of-the-art weak text classifiers across four real-world text
classification datasets, in addition to assigning ICD codes to medical notes in
the publicly available MIMIC-III database.
- Abstract(参考訳): 医療提供者は通常、臨床、研究、請求のために各患者に提供された臨床ケアの詳細な記録を記録する。
これらの物語の構造化されていない性質から、プロバイダは、icd(international classification of disease)コーディングシステムを使用して、患者の診断に診断コードを割り当てる専門スタッフを雇っている。
この手動プロセスは時間を消費するだけでなく、コストとエラーが発生しやすい。
以前の研究では、このプロセスの自動化における機械学習(ml)方法論の潜在的有用性が示されたが、モデルのトレーニングには大量の手作業によるラベル付きデータに頼っていた。
さらに、診断コーディングシステムは時間とともに進化し、従来の教師付き学習戦略はローカルアプリケーションを超えて一般化できない。
本稿では,人間ラベル文書を使わずに,クラスラベル記述からのみ学習できる汎用的弱教師付きテキスト分類フレームワークを提案する。
事前学習された言語モデルに格納された言語ドメイン知識とデータプログラミングフレームワークを活用して、個々のテキストにコードラベルを割り当てる。
本稿では,本手法の有効性と柔軟性を,実世界の4つのテキスト分類データセットにまたがる最先端の弱いテキスト分類器と比較し,icdコードをミームiiiデータベースの医用ノートに割り当てることによって実証する。
関連論文リスト
- UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Automatic Coding at Scale: Design and Deployment of a Nationwide System
for Normalizing Referrals in the Chilean Public Healthcare System [0.0]
本稿では,チリの公共医療システムからの紹介で,疾患を自動的にコードする2段階のシステムを提案する。
具体的には,病名認識のための最新のNERモデルと,これらの疾患名に関連付けられた最も関連性の高いコードを割り当てるための検索エンジンシステムを用いている。
本システムでは,カテゴリレベルのMAPスコアが0.63,カテゴリレベルの0.83を得た。
論文 参考訳(メタデータ) (2023-07-09T16:19:35Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - A Systematic Literature Review of Automated ICD Coding and
Classification Systems using Discharge Summaries [5.156484100374058]
フリーテキスト臨床物語の体系化は、資金、保険請求処理、研究などの二次的用途に有用であると長年認識されてきた。
コードの割り当ての現在のシナリオは、非常にコストがかかり、時間がかかり、エラーが発生しやすい手作業のプロセスです。
この体系的な文献レビューは、自動化された臨床コーディングシステムの包括的概要を提供する。
論文 参考訳(メタデータ) (2021-07-12T03:55:17Z) - Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文 参考訳(メタデータ) (2021-04-12T18:11:17Z) - Does the Magic of BERT Apply to Medical Code Assignment? A Quantitative
Study [2.871614744079523]
事前訓練されたモデルが、さらなるアーキテクチャエンジニアリングなしで医療コード予測に有用かどうかは明らかではない。
本稿では,単語間のインタラクションをキャプチャし,ラベル情報を活用する階層的な微調整アーキテクチャを提案する。
現在の傾向とは対照的に、我々は慎重に訓練された古典的なCNNは、頻繁なコードでMIMIC-IIIサブセット上の注意ベースのモデルを上回ることを実証します。
論文 参考訳(メタデータ) (2021-03-11T07:23:45Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Automated Coding of Under-Studied Medical Concept Domains: Linking
Physical Activity Reports to the International Classification of Functioning,
Disability, and Health [22.196642357767338]
医療概念の多くの領域は、医学テキストの効果的なコーディングを支援するための、十分に発達した用語を欠いている。
本稿では,未研究の医療情報の自動符号化のための自然言語処理(NLP)技術を開発するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-27T20:02:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。