論文の概要: Entity Anchored ICD Coding
- arxiv url: http://arxiv.org/abs/2208.07444v1
- Date: Mon, 15 Aug 2022 21:41:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:06:45.806130
- Title: Entity Anchored ICD Coding
- Title(参考訳): エンティティアンコールIDD符号化
- Authors: Jay DeYoung, Han-Chin Shing, Luyang Kong, Christopher Winestock,
Chaitanya Shivade
- Abstract要約: 我々は、ICDコードとエンティティの文脈的表現を構築し、これらの表現を集約して文書レベルの予測を作成する。
サイズやトレーニングで見られるコードによって固定された表現を使用する既存のメソッドとは対照的に、コード記述をローカルコンテキストでエンコードすることで、ICDコードを表現する。
我々の手法は,まれなコードや目に見えないコードのパフォーマンスを含む,標準およびデプロイ可能な方法の両方において,既存の方法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 7.742895084715075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical coding is a complex task, requiring assignment of a subset of over
72,000 ICD codes to a patient's notes. Modern natural language processing
approaches to these tasks have been challenged by the length of the input and
size of the output space. We limit our model inputs to a small window around
medical entities found in our documents. From those local contexts, we build
contextualized representations of both ICD codes and entities, and aggregate
over these representations to form document-level predictions. In contrast to
existing methods which use a representation fixed either in size or by codes
seen in training, we represent ICD codes by encoding the code description with
local context. We discuss metrics appropriate to deploying coding systems in
practice. We show that our approach is superior to existing methods in both
standard and deployable measures, including performance on rare and unseen
codes.
- Abstract(参考訳): 医療コーディングは複雑な作業であり、患者のノートに72,000のICD符号のサブセットを割り当てる必要がある。
これらのタスクに対する現代の自然言語処理アプローチは、出力空間の入力とサイズの長さによって挑戦されてきた。
モデル入力は、ドキュメントにある医療エンティティの周りの小さなウィンドウに制限します。
これらのローカルなコンテキストから、ICDコードとエンティティの両方のコンテキスト化された表現を構築し、これらの表現を集約して文書レベルの予測を作成する。
サイズやトレーニングで見られるコードで固定された表現を使用する既存のメソッドとは対照的に、コード記述をローカルコンテキストでエンコードすることでicdコードを表現する。
コーディングシステムのデプロイに適切なメトリクスについて検討する。
提案手法は,レアコードやアンセインコードのパフォーマンスなど,標準およびデプロイ可能な手段で既存の手法よりも優れていることを示す。
関連論文リスト
- A Novel ICD Coding Method Based on Associated and Hierarchical Code Description Distillation [6.524062529847299]
ICD符号化は、ノイズの多い医療文書入力による多ラベルテキスト分類の問題である。
近年のICD符号化の進歩により、医療用ノートやコードに付加的なデータや知識ベースを組み込むことで、性能が向上した。
コード表現学習の改善と不適切なコード代入の回避を目的とした,関連および階層型コード記述蒸留(AHDD)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T07:26:23Z) - Exploring LLM Multi-Agents for ICD Coding [15.730751450511333]
ICD符号化のためのマルチエージェント方式は実世界の符号化プロセスを効果的に模倣し、一般的な符号と稀な符号の両方の性能を向上させる。
提案手法は, 事前学習や微調整を必要とする最先端のICD符号化手法に匹敵する結果を得るとともに, 稀なコード精度, 説明可能性で性能を向上する。
論文 参考訳(メタデータ) (2024-04-01T15:17:39Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Accurate and Well-Calibrated ICD Code Assignment Through Attention Over
Diverse Label Embeddings [1.201425717264024]
ICDコードを臨床テキストに手動で割り当てるのは、時間がかかり、エラーが発生し、コストがかかる。
本稿では,ICDの自動符号化のための新しい手法について述べる。
MIMIC-IIIデータセットの異なる分割による実験は、提案手法がICD符号化における現在の最先端モデルより優れていることを示している。
論文 参考訳(メタデータ) (2024-02-05T16:40:23Z) - Code Prompting: a Neural Symbolic Method for Complex Reasoning in Large
Language Models [74.95486528482327]
コードプロンプト(code prompting)は、ゼロショットバージョンと少数ショットバージョンの両方を持ち、中間ステップとしてコードをトリガーするニューラルシンボルプロンプトである。
我々は,記号的推論と算術的推論を含む7つの広く使用されているベンチマーク実験を行った。
論文 参考訳(メタデータ) (2023-05-29T15:14:09Z) - A Two-Stage Decoder for Efficient ICD Coding [10.634394331433322]
ICD符号の予測のための2段階復号機構を提案する。
まず、まず親コードを予測し、その子コードを前回の予測に基づいて予測する。
公開MIMIC-IIIデータセット実験により,本モデルが単一モデル設定で良好に動作することを示す。
論文 参考訳(メタデータ) (2023-05-27T17:25:13Z) - Soft-Labeled Contrastive Pre-training for Function-level Code
Representation [127.71430696347174]
textbfSoft-labeled contrastive pre-training framework with two positive sample construction method。
大規模コードコーパスにおけるコード間の関連性を考慮すると、ソフトラベル付きコントラスト付き事前学習は、きめ細かいソフトラベルを得ることができる。
SCodeRは、7つのデータセットで4つのコード関連タスクに対して、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T05:17:37Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - Towards BERT-based Automatic ICD Coding: Limitations and Opportunities [6.2211479935811775]
バイオメディカル言語理解のための最先端トランスフォーマモデルであるPubMedBERTを用いたICD符号化について検討する。
ICD符号化におけるBERTモデルの主な制限は,長いテキストでモデルを微調整することの難しさにある。
BERTベースのICDコーディングを改善するための主な必要性として、長いテキストから情報を集約するより良い方法を挙げます。
論文 参考訳(メタデータ) (2021-04-14T09:12:53Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。