論文の概要: From Extreme Multi-label to Multi-class: A Hierarchical Approach for
Automated ICD-10 Coding Using Phrase-level Attention
- arxiv url: http://arxiv.org/abs/2102.09136v1
- Date: Thu, 18 Feb 2021 03:19:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:33:33.163483
- Title: From Extreme Multi-label to Multi-class: A Hierarchical Approach for
Automated ICD-10 Coding Using Phrase-level Attention
- Title(参考訳): 極端なマルチラベルからマルチクラスへ:フレーズレベルの注意によるicd-10符号化の階層的アプローチ
- Authors: Cansu Sen, Bingyang Ye, Javed Aslam, Amir Tahmasebi
- Abstract要約: 臨床コーディングは、ICD(International Classification of Diseases)と呼ばれる一組のアルファ数値符号を、臨床物語で捉えた文脈に基づいて医療イベントに割り当てるタスクである。
本論文では, 階層的解を用いて, 極限多ラベル問題から単純多クラス問題へ再構成し, 自動ICD符号化のための新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 4.387302129801651
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clinical coding is the task of assigning a set of alphanumeric codes,
referred to as ICD (International Classification of Diseases), to a medical
event based on the context captured in a clinical narrative. The latest version
of ICD, ICD-10, includes more than 70,000 codes. As this is a labor-intensive
and error-prone task, automatic ICD coding of medical reports using machine
learning has gained significant interest in the last decade. Existing
literature has modeled this problem as a multi-label task. Nevertheless, such
multi-label approach is challenging due to the extremely large label set size.
Furthermore, the interpretability of the predictions is essential for the
endusers (e.g., healthcare providers and insurance companies). In this paper,
we propose a novel approach for automatic ICD coding by reformulating the
extreme multi-label problem into a simpler multi-class problem using a
hierarchical solution. We made this approach viable through extensive data
collection to acquire phrase-level human coder annotations to supervise our
models on learning the specific relations between the input text and predicted
ICD codes. Our approach employs two independently trained networks, the
sentence tagger and the ICD classifier, stacked hierarchically to predict a
codeset for a medical report. The sentence tagger identifies focus sentences
containing a medical event or concept relevant to an ICD coding. Using a
supervised attention mechanism, the ICD classifier then assigns each focus
sentence with an ICD code. The proposed approach outperforms strong baselines
by large margins of 23% in subset accuracy, 18% in micro-F1, and 15% in
instance based F-1. With our proposed approach, interpretability is achieved
not through implicitly learned attention scores but by attributing each
prediction to a particular sentence and words selected by human coders.
- Abstract(参考訳): 臨床コーディングは、ICD(International Classification of Diseases)と呼ばれる一組のアルファ数値符号を、臨床物語で捉えた文脈に基づいて医療イベントに割り当てるタスクである。
ICD-10の最新バージョンには70,000以上のコードが含まれている。
これは労働集約的でエラーを起こしやすいタスクであるため、機械学習を用いた医療レポートの自動ICDコーディングは、過去10年間で大きな関心を集めている。
既存の文献ではこの問題をマルチラベルタスクとしてモデル化している。
しかし、非常に大きなラベルセットサイズのため、そのようなマルチラベルアプローチは困難である。
さらに、予測の解釈性はエンドユーザー(医療提供者や保険会社など)にとって不可欠である。
本稿では,過度なマルチラベル問題を階層的解法を用いて,より単純なマルチクラス問題に書き換えることにより,自動ICD符号化のための新しい手法を提案する。
このアプローチを広範なデータ収集を通じて実現し、フレーズレベルのヒューマンコーダアノテーションを取得し、入力テキストと予測IDDコードの特定の関係を学習するモデルを監督しました。
本手法では,個別に学習した2つのネットワーク,ment taggerとicd分類器を階層的に積み重ねて医療報告用コードを予測する。
文タガーは、ICD符号化に関連する医療イベントまたは概念を含む焦点文を識別する。
教師付き注意機構を用いて、ICD分類器は、各フォーカス文にICD符号を割り当てる。
提案手法は,サブセット精度が23%,マイクロF1が18%,インスタンスベースF-1が15%と,強力なベースラインを上回っている。
提案手法では、暗黙的に学習した注意スコアではなく、人間のコーダによって選択された特定の文や単語に各予測を帰属させることで解釈可能となる。
関連論文リスト
- Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.323705343864336]
3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文 参考訳(メタデータ) (2024-05-29T13:44:07Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - A Two-Stage Decoder for Efficient ICD Coding [10.634394331433322]
ICD符号の予測のための2段階復号機構を提案する。
まず、まず親コードを予測し、その子コードを前回の予測に基づいて予測する。
公開MIMIC-IIIデータセット実験により,本モデルが単一モデル設定で良好に動作することを示す。
論文 参考訳(メタデータ) (2023-05-27T17:25:13Z) - An Automatic ICD Coding Network Using Partition-Based Label Attention [2.371982686172067]
本稿では,2種類のエンコーダと2種類のラベルアテンション層からなるニューラルネットワークアーキテクチャを提案する。
入力テキストは、前者エンコーダにセグメント符号化され、従者によって統合される。
この結果から,ネットワークは分割機構に基づくICD符号化性能の向上を図っている。
論文 参考訳(メタデータ) (2022-11-15T07:11:01Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - Few-Shot Electronic Health Record Coding through Graph Contrastive
Learning [64.8138823920883]
我々は,グラフベースのEHRコーディングフレームワークであるCoGraphを用いて,頻繁かつ希少なICD符号の性能向上を図る。
CoGraphは、異なるICDコードからHEWEグラフ間の類似点と相似点を学習し、それら間で情報を転送する。
2つのグラフコントラスト学習スキームであるGSCLとGECLは、HEWEグラフ構造を利用して、転送可能な特徴を符号化する。
論文 参考訳(メタデータ) (2021-06-29T14:53:17Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - A Label Attention Model for ICD Coding from Clinical Text [14.910833190248319]
自動ICD符号化のための新しいラベルアテンションモデルを提案する。
ICDコードに関連するテキストフラグメントの様々な長さと相互依存の両方を扱うことができる。
本モデルでは,3つのベンチマークMIMICデータセットに対して,最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2020-07-13T12:42:43Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。