論文の概要: Accurate and Well-Calibrated ICD Code Assignment Through Attention Over
Diverse Label Embeddings
- arxiv url: http://arxiv.org/abs/2402.03172v1
- Date: Mon, 5 Feb 2024 16:40:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 14:55:53.751193
- Title: Accurate and Well-Calibrated ICD Code Assignment Through Attention Over
Diverse Label Embeddings
- Title(参考訳): 横ラベル埋め込みに対する注意による精度・校正ICD符号割り当て
- Authors: Gon\c{c}alo Gomes, Isabel Coutinho, Bruno Martins
- Abstract要約: ICDコードを臨床テキストに手動で割り当てるのは、時間がかかり、エラーが発生し、コストがかかる。
本稿では,ICDの自動符号化のための新しい手法について述べる。
MIMIC-IIIデータセットの異なる分割による実験は、提案手法がICD符号化における現在の最先端モデルより優れていることを示している。
- 参考スコア(独自算出の注目度): 1.201425717264024
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although the International Classification of Diseases (ICD) has been adopted
worldwide, manually assigning ICD codes to clinical text is time-consuming,
error-prone, and expensive, motivating the development of automated approaches.
This paper describes a novel approach for automated ICD coding, combining
several ideas from previous related work. We specifically employ a strong
Transformer-based model as a text encoder and, to handle lengthy clinical
narratives, we explored either (a) adapting the base encoder model into a
Longformer, or (b) dividing the text into chunks and processing each chunk
independently. The representations produced by the encoder are combined with a
label embedding mechanism that explores diverse ICD code synonyms. Experiments
with different splits of the MIMIC-III dataset show that the proposed approach
outperforms the current state-of-the-art models in ICD coding, with the label
embeddings significantly contributing to the good performance. Our approach
also leads to properly calibrated classification results, which can effectively
inform downstream tasks such as quantification.
- Abstract(参考訳): 国際疾病分類 (ICD) は世界中で採用されているが、手動でICDコードを臨床テキストに割り当てるのは、時間がかかり、エラーが発生し、コストがかかり、自動化されたアプローチの開発を動機付けている。
本稿では,ICDの自動符号化のための新しい手法について述べる。
具体的には,テキストエンコーダとして強力なトランスフォーマーモデルを用いて,長期臨床物語の処理を行う。
(a)ベースエンコーダモデルをロングフォーマに適応すること、又は
b) テキストをチャンクに分割し、各チャンクを独立して処理する。
エンコーダによって生成された表現は、多様なICDコードシノニムを探索するラベル埋め込み機構と組み合わせられる。
MIMIC-IIIデータセットの異なる分割実験により、提案手法はICD符号化における現在の最先端モデルよりも優れており、ラベルの埋め込みは優れた性能に大きく寄与することが示された。
また,提案手法は,定量化などの下流タスクに効果的に報知できる適切な分類結果をもたらす。
関連論文リスト
- Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.323705343864336]
3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文 参考訳(メタデータ) (2024-05-29T13:44:07Z) - Unified Generation, Reconstruction, and Representation: Generalized Diffusion with Adaptive Latent Encoding-Decoding [90.77521413857448]
深層生成モデルは,3つのコア機能 – 新たなインスタンスの生成,入力の再構築,コンパクト表現の学習 – に固定されている。
一般化逆変換拡散確率モデル(EDDPM)を導入する。
EDDPMはパラメタライズされた符号化復号を導入することで標準拡散におけるガウス雑音化を一般化する。
テキスト、タンパク質、画像の実験は、多様なデータやタスクを扱う柔軟性を示している。
論文 参考訳(メタデータ) (2024-02-29T10:08:57Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - An Automatic ICD Coding Network Using Partition-Based Label Attention [2.371982686172067]
本稿では,2種類のエンコーダと2種類のラベルアテンション層からなるニューラルネットワークアーキテクチャを提案する。
入力テキストは、前者エンコーダにセグメント符号化され、従者によって統合される。
この結果から,ネットワークは分割機構に基づくICD符号化性能の向上を図っている。
論文 参考訳(メタデータ) (2022-11-15T07:11:01Z) - String-based Molecule Generation via Multi-decoder VAE [56.465033997245776]
可変オートエンコーダ(VAE)による文字列型分子生成の問題点について検討する。
本稿では,そのタスクに対するVAEの性能を改善するための,シンプルで効果的なアイデアを提案する。
実験では,提案するVAEモデルを用いて,領域外分布からサンプルを生成する。
論文 参考訳(メタデータ) (2022-08-23T03:56:30Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - A Pseudo Label-wise Attention Network for Automatic ICD Coding [17.076068093443684]
本稿では,ICD(International Classification of Diseases)符号化の課題に対処するために,ラベルを意識した疑似アテンション機構を提案する。
異なるICDコードに対する異なるアテンションモードを計算する代わりに、擬似ラベル対応アテンション機構は、類似のICDコードと自動的にマージし、類似のICDコードに対して1つのアテンションモードしか計算しない。
提案モデルは,MIMIC-IIIデータセットとプライベートXiangyaデータセットにおいて優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-06-12T17:03:27Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - A Label Attention Model for ICD Coding from Clinical Text [14.910833190248319]
自動ICD符号化のための新しいラベルアテンションモデルを提案する。
ICDコードに関連するテキストフラグメントの様々な長さと相互依存の両方を扱うことができる。
本モデルでは,3つのベンチマークMIMICデータセットに対して,最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2020-07-13T12:42:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。