論文の概要: A Label Attention Model for ICD Coding from Clinical Text
- arxiv url: http://arxiv.org/abs/2007.06351v1
- Date: Mon, 13 Jul 2020 12:42:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 22:48:08.222850
- Title: A Label Attention Model for ICD Coding from Clinical Text
- Title(参考訳): 臨床テキストからのICD符号化のためのラベルアテンションモデル
- Authors: Thanh Vu, Dat Quoc Nguyen, Anthony Nguyen
- Abstract要約: 自動ICD符号化のための新しいラベルアテンションモデルを提案する。
ICDコードに関連するテキストフラグメントの様々な長さと相互依存の両方を扱うことができる。
本モデルでは,3つのベンチマークMIMICデータセットに対して,最先端の新たな結果が得られる。
- 参考スコア(独自算出の注目度): 14.910833190248319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: ICD coding is a process of assigning the International Classification of
Disease diagnosis codes to clinical/medical notes documented by health
professionals (e.g. clinicians). This process requires significant human
resources, and thus is costly and prone to error. To handle the problem,
machine learning has been utilized for automatic ICD coding. Previous
state-of-the-art models were based on convolutional neural networks, using a
single/several fixed window sizes. However, the lengths and interdependence
between text fragments related to ICD codes in clinical text vary
significantly, leading to the difficulty of deciding what the best window sizes
are. In this paper, we propose a new label attention model for automatic ICD
coding, which can handle both the various lengths and the interdependence of
the ICD code related text fragments. Furthermore, as the majority of ICD codes
are not frequently used, leading to the extremely imbalanced data issue, we
additionally propose a hierarchical joint learning mechanism extending our
label attention model to handle the issue, using the hierarchical relationships
among the codes. Our label attention model achieves new state-of-the-art
results on three benchmark MIMIC datasets, and the joint learning mechanism
helps improve the performances for infrequent codes.
- Abstract(参考訳): icdコーディング(icd coding)は、医療専門家(例えば臨床医)が記録した臨床・医療記録に、疾病診断符号の国際分類を割り当てるプロセスである。
このプロセスには相当な人的資源が必要で、コストがかかりエラーを起こしやすい。
この問題に対処するため、機械学習は自動ICD符号化に利用されている。
従来の最先端モデルでは、単一の固定ウィンドウサイズを使用して畳み込みニューラルネットワークをベースとしていた。
しかし, 臨床テキスト中のICD符号に関連するテキスト断片の長さと相互依存性は著しく異なり, 最適なウィンドウサイズを決定するのが困難である。
本稿では,ICDコード関連テキストフラグメントの様々な長さと相互依存性を扱える自動ICD符号化のための新しいラベルアテンションモデルを提案する。
さらに,多くのICD符号が頻繁には使われていないため,非常に不均衡なデータ問題につながるため,符号間の階層的関係を利用して,ラベルアテンションモデルを拡張した階層的共同学習機構も提案する。
ラベルアテンションモデルは3つのベンチマーク模倣データセットで新たな最先端結果を達成し,共同学習機構は不適切なコードのパフォーマンス向上に寄与する。
関連論文リスト
- Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.323705343864336]
3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文 参考訳(メタデータ) (2024-05-29T13:44:07Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Accurate and Well-Calibrated ICD Code Assignment Through Attention Over
Diverse Label Embeddings [1.201425717264024]
ICDコードを臨床テキストに手動で割り当てるのは、時間がかかり、エラーが発生し、コストがかかる。
本稿では,ICDの自動符号化のための新しい手法について述べる。
MIMIC-IIIデータセットの異なる分割による実験は、提案手法がICD符号化における現在の最先端モデルより優れていることを示している。
論文 参考訳(メタデータ) (2024-02-05T16:40:23Z) - An Automatic ICD Coding Network Using Partition-Based Label Attention [2.371982686172067]
本稿では,2種類のエンコーダと2種類のラベルアテンション層からなるニューラルネットワークアーキテクチャを提案する。
入力テキストは、前者エンコーダにセグメント符号化され、従者によって統合される。
この結果から,ネットワークは分割機構に基づくICD符号化性能の向上を図っている。
論文 参考訳(メタデータ) (2022-11-15T07:11:01Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - Few-Shot Electronic Health Record Coding through Graph Contrastive
Learning [64.8138823920883]
我々は,グラフベースのEHRコーディングフレームワークであるCoGraphを用いて,頻繁かつ希少なICD符号の性能向上を図る。
CoGraphは、異なるICDコードからHEWEグラフ間の類似点と相似点を学習し、それら間で情報を転送する。
2つのグラフコントラスト学習スキームであるGSCLとGECLは、HEWEグラフ構造を利用して、転送可能な特徴を符号化する。
論文 参考訳(メタデータ) (2021-06-29T14:53:17Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - From Extreme Multi-label to Multi-class: A Hierarchical Approach for
Automated ICD-10 Coding Using Phrase-level Attention [4.387302129801651]
臨床コーディングは、ICD(International Classification of Diseases)と呼ばれる一組のアルファ数値符号を、臨床物語で捉えた文脈に基づいて医療イベントに割り当てるタスクである。
本論文では, 階層的解を用いて, 極限多ラベル問題から単純多クラス問題へ再構成し, 自動ICD符号化のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-18T03:19:14Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。