論文の概要: Structured Information Matters: Explainable ICD Coding with Patient-Level Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2509.09699v1
- Date: Thu, 04 Sep 2025 12:01:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-21 06:05:45.726449
- Title: Structured Information Matters: Explainable ICD Coding with Patient-Level Knowledge Graphs
- Title(参考訳): 構造化情報: 患者レベル知識グラフを用いた説明可能なICD符号化
- Authors: Mingyang Li, Viktor Schlegel, Tingting Mu, Warren Del-Pinto, Goran Nenadic,
- Abstract要約: 臨床文書を標準化された臨床語彙にマッピングすることは重要な課題であり、情報検索と分析のための構造化データを提供する。
手動のコーディングは難しく、時間を要するため、大規模では実用的ではありません。
入力文書の構造化表現を計算し、患者の状態の包括的構造化ビューを提供する文書レベルの知識グラフ(KG)を利用する。
実験の結果,一般的なベンチマークでは最大3.20%向上し,トレーニング効率が向上した。
- 参考スコア(独自算出の注目度): 20.885050690051706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mapping clinical documents to standardised clinical vocabularies is an important task, as it provides structured data for information retrieval and analysis, which is essential to clinical research, hospital administration and improving patient care. However, manual coding is both difficult and time-consuming, making it impractical at scale. Automated coding can potentially alleviate this burden, improving the availability and accuracy of structured clinical data. The task is difficult to automate, as it requires mapping to high-dimensional and long-tailed target spaces, such as the International Classification of Diseases (ICD). While external knowledge sources have been readily utilised to enhance output code representation, the use of external resources for representing the input documents has been underexplored. In this work, we compute a structured representation of the input documents, making use of document-level knowledge graphs (KGs) that provide a comprehensive structured view of a patient's condition. The resulting knowledge graph efficiently represents the patient-centred input documents with 23\% of the original text while retaining 90\% of the information. We assess the effectiveness of this graph for automated ICD-9 coding by integrating it into the state-of-the-art ICD coding architecture PLM-ICD. Our experiments yield improved Macro-F1 scores by up to 3.20\% on popular benchmarks, while improving training efficiency. We attribute this improvement to different types of entities and relationships in the KG, and demonstrate the improved explainability potential of the approach over the text-only baseline.
- Abstract(参考訳): 臨床文献を標準化された臨床語彙にマッピングすることは重要な課題であり、臨床研究、病院管理、患者ケアの改善に不可欠である情報検索と分析のための構造化データを提供する。
しかし、手動のコーディングは困難かつ時間を要するため、大規模では実用的ではない。
自動コーディングは、この負担を軽減する可能性があり、構造化された臨床データの可用性と精度を向上させる。
このタスクは、ICD(International Classification of Diseases)のような高次元および長い尾を持つターゲット空間へのマッピングを必要とするため、自動化が難しい。
外部の知識ソースは出力コード表現を強化するために容易に利用されてきたが、入力文書を表す外部リソースの使用は過小評価されている。
本研究では,患者状態の包括的構造化ビューを提供する文書レベルの知識グラフ(KG)を用いて,入力文書の構造化表現を計算する。
得られた知識グラフは、患者中心の入力文書を、90%の情報を保持しつつ、元のテキストの23倍の精度で効率よく表現する。
我々は,最新のICD符号化アーキテクチャ PLM-ICD に統合することで,ICD-9 の自動符号化におけるこのグラフの有効性を評価する。
実験の結果,一般的なベンチマークでは最大3.20\%向上し,トレーニング効率が向上した。
この改善は、KGにおける異なるタイプのエンティティと関係に起因し、テキストのみのベースラインに対するアプローチの説明可能性の向上を実証する。
関連論文リスト
- Extracting OPQRST in Electronic Health Records using Large Language Models with Reasoning [3.486461799078777]
本稿では,Large Language Models (LLM) の機能を活用して,EHRからOPQRSTアセスメントを抽出するための新しいアプローチを提案する。
本稿では,医師の認知過程を模倣する推論ステップをモデルに提供できるように,シーケンスラベリングからテキスト生成へタスクを再構成することを提案する。
当社のコントリビューションは、医療におけるAIの利用の大幅な進歩を示し、EHRからの情報抽出の正確性とユーザビリティを向上させるスケーラブルなソリューションを提供しています。
論文 参考訳(メタデータ) (2025-09-02T02:21:02Z) - Bridging Electronic Health Records and Clinical Texts: Contrastive Learning for Enhanced Clinical Tasks [0.0]
本稿では,構造化EHRデータの潜在表現を非構造化放電要約ノートと整合させるフレームワークを提案する。
ペアのEHRとテキストの埋め込みをまとめて、障害のないものを分解する。
その結果,臨床ノートからEHRベースのパイプラインにドメイン知識を統合する効果が示された。
論文 参考訳(メタデータ) (2025-05-23T09:04:49Z) - Cross-Institutional Dental EHR Entity Extraction via Generative AI and Synthetic Notes [6.132077347366551]
本研究は, 未構造化テキストから診断情報を抽出することにより, 歯科記録に欠落する構造データの問題に対処する。
我々は、GPT-4を利用した高度なAIおよびNLP手法を用いて、RoBERTaモデルの微調整のための合成ノートを生成する。
2つのデータセットからランダムに選択した120個の臨床ノートを用いてモデルの評価を行い,診断精度の向上を実証した。
論文 参考訳(メタデータ) (2024-07-23T04:05:48Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Towards Unifying Anatomy Segmentation: Automated Generation of a
Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines [113.08940153125616]
我々は533巻のボクセルレベルのラベルを142ドル(約1万2000円)で、全身CTスキャンのデータセットを作成し、解剖学的包括的カバレッジを提供する。
提案手法はラベル集約段階において手作業によるアノテーションに依存しない。
我々はCTデータに142ドルの解剖学的構造を予測できる統一解剖学的セグメンテーションモデルをリリースする。
論文 参考訳(メタデータ) (2023-07-25T09:48:13Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Classifying Unstructured Clinical Notes via Automatic Weak Supervision [17.45660355026785]
クラスラベル記述のみから学習する、一般的な弱教師付きテキスト分類フレームワークを導入する。
我々は、事前訓練された言語モデルとデータプログラミングフレームワークに格納された言語ドメインの知識を活用して、テキストにコードラベルを割り当てる。
論文 参考訳(メタデータ) (2022-06-24T05:55:49Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - Benchmark datasets driving artificial intelligence development fail to
capture the needs of medical professionals [4.799783526620609]
臨床およびバイオメディカル自然言語処理(NLP)の幅広い領域に関するデータセットとベンチマークのカタログを公開した。
450のNLPデータセットが手動で体系化され、豊富なメタデータで注釈付けされた。
我々の分析は、AIベンチマークの直接臨床関連性は乏しく、臨床医が対応したい仕事のほとんどをカバーできないことを示唆している。
論文 参考訳(メタデータ) (2022-01-18T15:05:28Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。