論文の概要: A Pseudo Label-wise Attention Network for Automatic ICD Coding
- arxiv url: http://arxiv.org/abs/2106.06822v1
- Date: Sat, 12 Jun 2021 17:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 16:13:12.202276
- Title: A Pseudo Label-wise Attention Network for Automatic ICD Coding
- Title(参考訳): Pseudo Label-wise Attention Network for Automatic ICD Coding
- Authors: Yifan Wu, Min Zeng, Ying Yu, Min Li
- Abstract要約: 本稿では,ICD(International Classification of Diseases)符号化の課題に対処するために,ラベルを意識した疑似アテンション機構を提案する。
異なるICDコードに対する異なるアテンションモードを計算する代わりに、擬似ラベル対応アテンション機構は、類似のICDコードと自動的にマージし、類似のICDコードに対して1つのアテンションモードしか計算しない。
提案モデルは,MIMIC-IIIデータセットとプライベートXiangyaデータセットにおいて優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 17.076068093443684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic International Classification of Diseases (ICD) coding is defined as
a kind of text multi-label classification problem, which is difficult because
the number of labels is very large and the distribution of labels is
unbalanced. The label-wise attention mechanism is widely used in automatic ICD
coding because it can assign weights to every word in full Electronic Medical
Records (EMR) for different ICD codes. However, the label-wise attention
mechanism is computational redundant and costly. In this paper, we propose a
pseudo label-wise attention mechanism to tackle the problem. Instead of
computing different attention modes for different ICD codes, the pseudo
label-wise attention mechanism automatically merges similar ICD codes and
computes only one attention mode for the similar ICD codes, which greatly
compresses the number of attention modes and improves the predicted accuracy.
In addition, we apply a more convenient and effective way to obtain the ICD
vectors, and thus our model can predict new ICD codes by calculating the
similarities between EMR vectors and ICD vectors. Extensive experiments show
the superior performance of our model. On the public MIMIC-III dataset and
private Xiangya dataset, our model achieves micro f1 of 0.575 and 0.796,
respectively, which outperforms other competing models. Furthermore, we verify
the ability of our model in predicting new ICD codes. The case study shows how
pseudo label-wise attention works, and demonstrates the effectiveness of pseudo
label-wise attention mechanism.
- Abstract(参考訳): 自動病原体分類(ICD)符号化はテキスト多ラベル分類問題の一種として定義されており,ラベルの数がとても多く,ラベルの分布が不均衡であるため難しい。
ラベルワイドアテンション機構は、異なるICD符号に対して完全な電子医療記録(EMR)に含まれる全ての単語に重みを割り当てることができるため、自動ICD符号化において広く用いられている。
しかし,ラベル単位の注意機構は冗長であり,コストがかかる。
本稿では,この問題に取り組むための擬似ラベルワイズ注意機構を提案する。
異なるICD符号の異なるアテンションモードを計算する代わりに、擬似ラベル対応アテンション機構が自動的に類似のICD符号とマージし、類似のICD符号のアテンションモードを1つだけ計算し、アテンションモードの数を大幅に圧縮し、予測精度を向上させる。
さらに, より便利かつ効果的にICDベクトルを得る方法を適用することにより, EMRベクトルとICDベクトルとの類似性を計算することにより, 新しいICD符号を予測できる。
広範な実験により,モデルの性能が向上した。
パブリックMIMIC-IIIデータセットとプライベートXiangyaデータセットでは,それぞれ0.575と0.796のマイクロf1を達成した。
さらに、新しいICD符号の予測におけるモデルの有効性を検証する。
本ケーススタディでは擬似ラベルワイズアテンションがどのように機能するかを示し,擬似ラベルワイズアテンション機構の有効性を示す。
関連論文リスト
- CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Accurate and Well-Calibrated ICD Code Assignment Through Attention Over
Diverse Label Embeddings [1.201425717264024]
ICDコードを臨床テキストに手動で割り当てるのは、時間がかかり、エラーが発生し、コストがかかる。
本稿では,ICDの自動符号化のための新しい手法について述べる。
MIMIC-IIIデータセットの異なる分割による実験は、提案手法がICD符号化における現在の最先端モデルより優れていることを示している。
論文 参考訳(メタデータ) (2024-02-05T16:40:23Z) - An Automatic ICD Coding Network Using Partition-Based Label Attention [2.371982686172067]
本稿では,2種類のエンコーダと2種類のラベルアテンション層からなるニューラルネットワークアーキテクチャを提案する。
入力テキストは、前者エンコーダにセグメント符号化され、従者によって統合される。
この結果から,ネットワークは分割機構に基づくICD符号化性能の向上を図っている。
論文 参考訳(メタデータ) (2022-11-15T07:11:01Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - Few-Shot Electronic Health Record Coding through Graph Contrastive
Learning [64.8138823920883]
我々は,グラフベースのEHRコーディングフレームワークであるCoGraphを用いて,頻繁かつ希少なICD符号の性能向上を図る。
CoGraphは、異なるICDコードからHEWEグラフ間の類似点と相似点を学習し、それら間で情報を転送する。
2つのグラフコントラスト学習スキームであるGSCLとGECLは、HEWEグラフ構造を利用して、転送可能な特徴を符号化する。
論文 参考訳(メタデータ) (2021-06-29T14:53:17Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - From Extreme Multi-label to Multi-class: A Hierarchical Approach for
Automated ICD-10 Coding Using Phrase-level Attention [4.387302129801651]
臨床コーディングは、ICD(International Classification of Diseases)と呼ばれる一組のアルファ数値符号を、臨床物語で捉えた文脈に基づいて医療イベントに割り当てるタスクである。
本論文では, 階層的解を用いて, 極限多ラベル問題から単純多クラス問題へ再構成し, 自動ICD符号化のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-18T03:19:14Z) - A Label Attention Model for ICD Coding from Clinical Text [14.910833190248319]
自動ICD符号化のための新しいラベルアテンションモデルを提案する。
ICDコードに関連するテキストフラグメントの様々な長さと相互依存の両方を扱うことができる。
本モデルでは,3つのベンチマークMIMICデータセットに対して,最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2020-07-13T12:42:43Z) - Overcoming Statistical Shortcuts for Open-ended Visual Counting [54.858754825838865]
出力ラベルに関係なく、カウントする適切なメカニズムを学習するモデルを開発することを目的としている。
まず,統計的ショートカットに過度に依存するモデルを罰するModifying Count Distributionプロトコルを提案する。
第2に、視覚分析と自然言語質問に基づく数え上げを専門とする空間カウントネットワーク(SCN)を導入する。
論文 参考訳(メタデータ) (2020-06-17T18:02:01Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。