論文の概要: Enhancing LLM Medical Coding with Structured External Knowledge
- arxiv url: http://arxiv.org/abs/2605.27377v2
- Date: Thu, 28 May 2026 04:48:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.503843
- Title: Enhancing LLM Medical Coding with Structured External Knowledge
- Title(参考訳): 構造化外部知識によるLLM医療符号化の強化
- Authors: Yidong Gan, David D. Nguyen, Yang Lin, Peter Zhong, Thanh Vu, Long Duong, Yuan-Fang Li,
- Abstract要約: 既存の LLM ベースの自動化手法は LLM の内部知識に大きく依存している。
RAG-Codingは,外部知識を構造化してLLMを増強するエージェントフリーな手法である。
MDACE-2025では、RAG-Codingはすべてのベースラインを上回り、更新されたガイドラインに対する効果的な一般化を実証している。
- 参考スコア(独自算出の注目度): 22.558079959261164
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate medical coding requires consulting authoritative resources such as the ICD tabular list and coding guidelines. Existing LLM-based automated methods largely rely on LLMs' internal knowledge, which is prone to hallucination and cannot keep pace with guideline updates. We introduce RAG-Coding, an agentic, training-free method that augments LLMs with structured external knowledge: the tabular list is encoded as a knowledge graph capturing hierarchical and instructional code relationships, and the guidelines are distilled into concise, code-specific summaries rather than retrieved as raw text. To enable our study, we also introduce MDACE-2025, expert re-annotations of the MDACE dataset under the 2025 ICD-10-CM/PCS guidelines, adding code sequencing and justification comments. On MDACE, RAG-Coding outperforms the best LLM-based baseline by 3--13\% in micro-F1 across five LLM backbones, and achieves comparable micro- and macro-F1 to the supervised state-of-the-art, with higher recall ($+$11\%) at the cost of precision ($-$6\%). On MDACE-2025, RAG-Coding outperforms all baselines, demonstrating effective generalisation to updated guidelines. Ablations confirm stepwise gains, highlighting the importance of integrating structured external knowledge for LLM-based medical coding.
- Abstract(参考訳): 正確な医療用コーディングには、ICD表表やコーディングガイドラインなどの信頼できるリソースをコンサルティングする必要がある。
既存の LLM ベースの自動化手法は LLM の内部知識に大きく依存している。
表表リストは階層的および命令的コード関係を抽出した知識グラフとしてエンコードされ、ガイドラインは原文として検索されるのではなく、簡潔でコード固有の要約に蒸留される。
2025 ICD-10-CM/PCSガイドラインに基づくMDACEデータセットのエキスパートアノテーションであるMDACE-2025も導入し,コードシークエンシングと正当化コメントを追加した。
MDACEでは、RAG-Codingは5つのLDMバックボーンのマイクロF1において3-13\%の最高のLCMベースラインを上回り、監督された最先端技術に匹敵するマイクロF1とマクロF1を達成し、精度の犠牲(-6\%)で高いリコール(+11\%)を達成している。
MDACE-2025では、RAG-Codingはすべてのベースラインを上回り、更新されたガイドラインに対する効果的な一般化を実証している。
アブレーションは段階的に向上し、LLMベースの医療コーディングのための構造化外的知識の統合の重要性を強調している。
関連論文リスト
- From Documents to Spans: Code-Centric Learning for LLM-based ICD Coding [29.729356191729888]
完全臨床文書からスケーラブルで短いエビデンスの範囲に監督を移行させるトレーニングフレームワークであるCode-Centric Learningを提案する。
提案するフレームワークは,学習コストを大幅に削減し,見えないICD符号の精度を向上し,解釈可能性を維持する,混合学習戦略とコード中心データ拡張から構成される。
論文 参考訳(メタデータ) (2026-03-16T13:37:01Z) - Post-Incorporating Code Structural Knowledge into Pretrained Models via ICL for Code Translation [15.73070332657629]
大規模言語モデル(LLM)はソフトウェアマイニングにおいて大きな進歩を遂げた。
ソースコードの構文構造を扱うことは 依然として課題です
本稿では、コード構造知識を事前学習したLLMに組み込むために、インコンテキスト学習(ICL)を用いる。
論文 参考訳(メタデータ) (2025-03-28T10:59:42Z) - OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models [76.59316249991657]
コードのための大規模言語モデル(LLM)は、コード生成、推論タスク、エージェントシステムなど、さまざまな領域で必須になっている。
オープンアクセスのコード LLM はプロプライエタリなモデルの性能レベルに近づきつつあるが、高品質なコード LLM は依然として限られている。
トップクラスのコードLLMであるOpenCoderは、主要なモデルに匹敵するパフォーマンスを達成するだけでなく、研究コミュニティの"オープンクックブック"としても機能します。
論文 参考訳(メタデータ) (2024-11-07T17:47:25Z) - CodecLM: Aligning Language Models with Tailored Synthetic Data [51.59223474427153]
命令追従能力のための高品質な合成データを適応的に生成するフレームワークであるCodecLMを紹介する。
まず、ターゲットの指示分布をキャプチャするために、オンザフライで生成された簡潔なキーワードであるメタデータにシード命令をエンコードする。
また、デコード中に自己論理とコントラストフィルタを導入し、データ効率の良いサンプルを調整する。
論文 参考訳(メタデータ) (2024-04-08T21:15:36Z) - KnowCoder: Coding Structured Knowledge into LLMs for Universal Information Extraction [59.039355258637315]
コード生成によるユニバーサル情報抽出(UIE)を行うためのLarge Language Model(LLM)であるKnowCoderを提案する。
KnowCoderは、異なるスキーマをPythonクラスに一様に変換するコードスタイルのスキーマ表現メソッドを導入した。
KnowCoderには、2フェーズの学習フレームワークがあり、コード事前トレーニングによるスキーマ理解能力と、命令チューニングによるスキーマ追従能力を向上させる。
論文 参考訳(メタデータ) (2024-03-12T14:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。