論文の概要: MHLAT: Multi-hop Label-wise Attention Model for Automatic ICD Coding
- arxiv url: http://arxiv.org/abs/2309.08868v1
- Date: Sat, 16 Sep 2023 04:13:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 18:52:07.608679
- Title: MHLAT: Multi-hop Label-wise Attention Model for Automatic ICD Coding
- Title(参考訳): mhlat: 自動icd符号化のためのマルチホップラベルワイズ注意モデル
- Authors: Junwen Duan, Han Jiang and Ying Yu
- Abstract要約: 国際疾患分類(ICD)コーディングは、ICDの診断コードを臨床ノートに割り当てる作業である。
以前の研究のシングルパス読解プロセスとは異なり、人間はテキストを読み、より自信のある回答を得るために定義をラベル付けする傾向がある。
本稿では,MHLAT(Multi-Hop Label-wise Attention)と呼ばれるモデルを提案する。
- 参考スコア(独自算出の注目度): 4.095500425523786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: International Classification of Diseases (ICD) coding is the task of
assigning ICD diagnosis codes to clinical notes. This can be challenging given
the large quantity of labels (nearly 9,000) and lengthy texts (up to 8,000
tokens). However, unlike the single-pass reading process in previous works,
humans tend to read the text and label definitions again to get more confident
answers. Moreover, although pretrained language models have been used to
address these problems, they suffer from huge memory usage. To address the
above problems, we propose a simple but effective model called the Multi-Hop
Label-wise ATtention (MHLAT), in which multi-hop label-wise attention is
deployed to get more precise and informative representations. Extensive
experiments on three benchmark MIMIC datasets indicate that our method achieves
significantly better or competitive performance on all seven metrics, with much
fewer parameters to optimize.
- Abstract(参考訳): 国際疾患分類(ICD)コーディングは、ICDの診断コードを臨床ノートに割り当てる作業である。
大量のラベル(約9000枚)と長いテキスト(最大8000枚までのトークン)を考えると、これは困難である。
しかし、以前の作品のシングルパス読解プロセスとは異なり、人間はテキストを読み、より自信のある回答を得るために定義をラベル付けする傾向がある。
さらに、これらの問題に対処するために事前学習された言語モデルが使われてきたが、膨大なメモリ使用量に苦しめられている。
上記の問題に対処するために,マルチホップラベルワイズ・アテンション(mhlat)と呼ばれる,より正確な情報表現を得るためにマルチホップラベルワイズアテンションを配置する簡易かつ効果的なモデルを提案する。
3つのベンチマークMIMICデータセットの大規模な実験は、我々の手法が7つの指標すべてに対して、はるかに優れた、または競合的な性能を達成し、最適化するパラメータがはるかに少ないことを示唆している。
関連論文リスト
- Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Multi-label Few-shot ICD Coding as Autoregressive Generation with Prompt [7.554528566861559]
本研究では,このマルチラベル分類タスクを自己回帰生成タスクに変換する。
ICD符号の高次元空間を直接予測する代わりに、我々のモデルはテキスト記述の低次元を生成する。
MIMIC-III-few実験により,従来のMIMIC-III-full SOTAモデルよりも大幅に優れるマルコF130.2が得られた。
論文 参考訳(メタデータ) (2022-11-24T22:10:50Z) - Modeling Diagnostic Label Correlation for Automatic ICD Coding [37.79764232289666]
ラベル相関をキャプチャして自動ICD符号化を改善するための2段階フレームワークを提案する。
具体的には,ラベル集合分布推定器を訓練し,各ラベル集合候補の確率を再評価する。
実験では,提案フレームワークはMIMICベンチマークデータセット上で最高の性能の予測器を改善することができる。
論文 参考訳(メタデータ) (2021-06-24T07:26:30Z) - A Pseudo Label-wise Attention Network for Automatic ICD Coding [17.076068093443684]
本稿では,ICD(International Classification of Diseases)符号化の課題に対処するために,ラベルを意識した疑似アテンション機構を提案する。
異なるICDコードに対する異なるアテンションモードを計算する代わりに、擬似ラベル対応アテンション機構は、類似のICDコードと自動的にマージし、類似のICDコードに対して1つのアテンションモードしか計算しない。
提案モデルは,MIMIC-IIIデータセットとプライベートXiangyaデータセットにおいて優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-06-12T17:03:27Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文 参考訳(メタデータ) (2021-04-12T18:11:17Z) - From Extreme Multi-label to Multi-class: A Hierarchical Approach for
Automated ICD-10 Coding Using Phrase-level Attention [4.387302129801651]
臨床コーディングは、ICD(International Classification of Diseases)と呼ばれる一組のアルファ数値符号を、臨床物語で捉えた文脈に基づいて医療イベントに割り当てるタスクである。
本論文では, 階層的解を用いて, 極限多ラベル問題から単純多クラス問題へ再構成し, 自動ICD符号化のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-18T03:19:14Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - Learning to Purify Noisy Labels via Meta Soft Label Corrector [49.92310583232323]
最近のディープニューラルネットワーク(DNN)は、ノイズラベルによるバイアス付きトレーニングデータに容易に適合する。
ラベル修正戦略はこの問題を軽減するために一般的に用いられる。
メタ学習モデルを提案する。
論文 参考訳(メタデータ) (2020-08-03T03:25:17Z) - A Label Attention Model for ICD Coding from Clinical Text [14.910833190248319]
自動ICD符号化のための新しいラベルアテンションモデルを提案する。
ICDコードに関連するテキストフラグメントの様々な長さと相互依存の両方を扱うことができる。
本モデルでは,3つのベンチマークMIMICデータセットに対して,最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2020-07-13T12:42:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。