論文の概要: Using LLMs for Multilingual Clinical Entity Linking to ICD-10
- arxiv url: http://arxiv.org/abs/2509.04868v1
- Date: Fri, 05 Sep 2025 07:30:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.508042
- Title: Using LLMs for Multilingual Clinical Entity Linking to ICD-10
- Title(参考訳): ICD-10への多言語臨床エンティティリンクにおけるLCMの使用
- Authors: Sylvia Vassileva, Ivan Koychev, Svetla Boytcheva,
- Abstract要約: LLM(Large Language Models)を用いた各種言語におけるICD-10コードへの臨床用語のリンク手法を提案する。
本システムは,スペイン語の異なるベンチマークデータセット上でのICD-10コード予測の有望な結果を示す。
- 参考スコア(独自算出の注目度): 3.7463543521744764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The linking of clinical entities is a crucial part of extracting structured information from clinical texts. It is the process of assigning a code from a medical ontology or classification to a phrase in the text. The International Classification of Diseases - 10th revision (ICD-10) is an international standard for classifying diseases for statistical and insurance purposes. Automatically assigning the correct ICD-10 code to terms in discharge summaries will simplify the work of healthcare professionals and ensure consistent coding in hospitals. Our paper proposes an approach for linking clinical terms to ICD-10 codes in different languages using Large Language Models (LLMs). The approach consists of a multistage pipeline that uses clinical dictionaries to match unambiguous terms in the text and then applies in-context learning with GPT-4.1 to predict the ICD-10 code for the terms that do not match the dictionary. Our system shows promising results in predicting ICD-10 codes on different benchmark datasets in Spanish - 0.89 F1 for categories and 0.78 F1 on subcategories on CodiEsp, and Greek - 0.85 F1 on ElCardioCC.
- Abstract(参考訳): 臨床エンティティのリンクは、臨床テキストから構造化情報を抽出する重要な部分である。
医学のオントロジーや分類からテキスト中のフレーズにコードを割り当てる過程である。
国際疾患分類 - 第10回改訂(ICD-10)は、統計・保険目的の疾患分類の国際規格である。
適切なICD-10コードを退院サマリーの項に自動的に割り当てることにより、医療従事者の作業が簡素化され、病院における一貫したコーディングが保証される。
本稿では,大規模言語モデル(LLM)を用いて,臨床用語を異なる言語におけるICD-10コードにリンクする手法を提案する。
このアプローチは、臨床辞書を用いてテキスト内の曖昧な用語を一致させ、GPT-4.1でテキスト内学習を適用して、辞書と一致しない用語のICD-10コードを予測する多段階パイプラインで構成されている。
我々のシステムは、スペイン語の異なるベンチマークデータセットのICD-10コード(カテゴリ別0.89 F1、CodiEspサブカテゴリ別0.78 F1、ElCardioCC用0.85 F1を予測できる有望な結果を示している。
関連論文リスト
- Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.323705343864336]
3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文 参考訳(メタデータ) (2024-05-29T13:44:07Z) - CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Automated clinical coding using off-the-shelf large language models [10.365958121087305]
診断用ICD符号を患者病院入院に割り当てる作業は、典型的には、熟練した人間のコーダーによって行われる。
自動ICD符号化への取り組みは、教師付きディープラーニングモデルによって支配されている。
本研究では,既製の事前学習型大規模言語モデルを活用し,実用的ソリューションを開発する。
論文 参考訳(メタデータ) (2023-10-10T11:56:48Z) - Automatic ICD-10 Code Association: A Challenging Task on French Clinical
Texts [0.0]
本稿では,ICDコードを自動的に関連付けるために,事前学習言語モデルを適用する。
ICD-10コードアソシエーションのためのNLPとマルチラベル分類の最新の進歩を組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2023-04-06T06:31:54Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - CoPHE: A Count-Preserving Hierarchical Evaluation Metric in Large-Scale
Multi-Label Text Classification [70.554573538777]
ニューラルLMTCモデルの予測の階層的評価について論じる。
先行技術における構造化ラベル空間の表現における構造的問題について述べる。
深度に基づく表現を用いた階層的評価のための指標セットを提案する。
論文 参考訳(メタデータ) (2021-09-10T13:09:12Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - From Extreme Multi-label to Multi-class: A Hierarchical Approach for
Automated ICD-10 Coding Using Phrase-level Attention [4.387302129801651]
臨床コーディングは、ICD(International Classification of Diseases)と呼ばれる一組のアルファ数値符号を、臨床物語で捉えた文脈に基づいて医療イベントに割り当てるタスクである。
本論文では, 階層的解を用いて, 極限多ラベル問題から単純多クラス問題へ再構成し, 自動ICD符号化のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-18T03:19:14Z) - Collaborative residual learners for automatic icd10 prediction using
prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。
平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文 参考訳(メタデータ) (2020-12-16T07:07:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。