論文の概要: Towards Semi-Structured Automatic ICD Coding via Tree-based Contrastive
Learning
- arxiv url: http://arxiv.org/abs/2310.09672v1
- Date: Sat, 14 Oct 2023 22:07:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 19:03:00.334928
- Title: Towards Semi-Structured Automatic ICD Coding via Tree-based Contrastive
Learning
- Title(参考訳): ツリーベースコントラスト学習による半構造化icd符号化
- Authors: Chang Lu, Chandan K. Reddy, Ping Wang, Yue Ning
- Abstract要約: 本稿では,臨床ノートの半構造化特性について検討し,それらをセクションに分割する自動アルゴリズムを提案する。
データ制限のある既存のICD符号化モデルにおける可変性問題に対処するため、セクションに対して対照的な事前学習アプローチを導入する。
- 参考スコア(独自算出の注目度): 18.380293890624102
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic coding of International Classification of Diseases (ICD) is a
multi-label text categorization task that involves extracting disease or
procedure codes from clinical notes. Despite the application of
state-of-the-art natural language processing (NLP) techniques, there are still
challenges including limited availability of data due to privacy constraints
and the high variability of clinical notes caused by different writing habits
of medical professionals and various pathological features of patients. In this
work, we investigate the semi-structured nature of clinical notes and propose
an automatic algorithm to segment them into sections. To address the
variability issues in existing ICD coding models with limited data, we
introduce a contrastive pre-training approach on sections using a soft
multi-label similarity metric based on tree edit distance. Additionally, we
design a masked section training strategy to enable ICD coding models to locate
sections related to ICD codes. Extensive experimental results demonstrate that
our proposed training strategies effectively enhance the performance of
existing ICD coding methods.
- Abstract(参考訳): 国際疾病分類(icd)の自動コーディングは、臨床ノートから疾患や手順コードを抽出することを含む多段テキスト分類タスクである。
最先端自然言語処理(NLP)技術の適用にもかかわらず、プライバシの制約によるデータの可用性の制限や、医療専門家の異なる筆記習慣による臨床ノートの高変動、患者の様々な病理学的特徴など、依然として課題がある。
本研究では,臨床ノートの半構造化的性質を調査し,それらを区分する自動アルゴリズムを提案する。
制限データを用いた既存ICD符号化モデルの変動性問題に対処するため,木編集距離に基づくソフトなマルチラベル類似度尺度を用いて,セクションに対する対照的な事前学習手法を提案する。
さらに、ICD符号化モデルがICDコードに関連するセクションを特定できるように、マスク付きセクショントレーニング戦略を設計する。
実験の結果,提案手法は既存のICD符号化手法の性能を効果的に向上することが示された。
関連論文リスト
- Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.323705343864336]
3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文 参考訳(メタデータ) (2024-05-29T13:44:07Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Accurate and Well-Calibrated ICD Code Assignment Through Attention Over
Diverse Label Embeddings [1.201425717264024]
ICDコードを臨床テキストに手動で割り当てるのは、時間がかかり、エラーが発生し、コストがかかる。
本稿では,ICDの自動符号化のための新しい手法について述べる。
MIMIC-IIIデータセットの異なる分割による実験は、提案手法がICD符号化における現在の最先端モデルより優れていることを示している。
論文 参考訳(メタデータ) (2024-02-05T16:40:23Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - A Label Attention Model for ICD Coding from Clinical Text [14.910833190248319]
自動ICD符号化のための新しいラベルアテンションモデルを提案する。
ICDコードに関連するテキストフラグメントの様々な長さと相互依存の両方を扱うことができる。
本モデルでは,3つのベンチマークMIMICデータセットに対して,最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2020-07-13T12:42:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。