論文の概要: Unlocking Historical Clinical Trial Data with ALIGN: A Compositional Large Language Model System for Medical Coding
- arxiv url: http://arxiv.org/abs/2411.13163v1
- Date: Wed, 20 Nov 2024 09:59:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:10:16.445931
- Title: Unlocking Historical Clinical Trial Data with ALIGN: A Compositional Large Language Model System for Medical Coding
- Title(参考訳): ALIGNによる歴史的臨床試験データのアンロック:医用符号化のための大規模言語モデルシステム
- Authors: Nabeel Seedat, Caterina Tozzi, Andrea Hita Ardiaca, Mihaela van der Schaar, James Weatherall, Adam Taylor,
- Abstract要約: 自動ゼロショット医療符号化のための新しい合成LLMシステムであるALIGNを紹介する。
我々は、ALIGNを解剖学的治療化学(ATC)と医学史用語に調和させ、MedDRA(Medicical Dictionary for Regulatory Activity)コードに評価した。
- 参考スコア(独自算出の注目度): 44.01429184037945
- License:
- Abstract: The reuse of historical clinical trial data has significant potential to accelerate medical research and drug development. However, interoperability challenges, particularly with missing medical codes, hinders effective data integration across studies. While Large Language Models (LLMs) offer a promising solution for automated coding without labeled data, current approaches face challenges on complex coding tasks. We introduce ALIGN, a novel compositional LLM-based system for automated, zero-shot medical coding. ALIGN follows a three-step process: (1) diverse candidate code generation; (2) self-evaluation of codes and (3) confidence scoring and uncertainty estimation enabling human deferral to ensure reliability. We evaluate ALIGN on harmonizing medication terms into Anatomical Therapeutic Chemical (ATC) and medical history terms into Medical Dictionary for Regulatory Activities (MedDRA) codes extracted from 22 immunology trials. ALIGN outperformed the LLM baselines, while also providing capabilities for trustworthy deployment. For MedDRA coding, ALIGN achieved high accuracy across all levels, matching RAG and excelling at the most specific levels (87-90% for HLGT). For ATC coding, ALIGN demonstrated superior performance, particularly at lower hierarchy levels (ATC Level 4), with 72-73% overall accuracy and 86-89% accuracy for common medications, outperforming baselines by 7-22%. ALIGN's uncertainty-based deferral improved accuracy by 17% to 90% accuracy with 30% deferral, notably enhancing performance on uncommon medications. ALIGN achieves this cost-efficiently at \$0.0007 and \$0.02 per code for GPT-4o-mini and GPT-4o, reducing barriers to clinical adoption. ALIGN advances automated medical coding for clinical trial data, contributing to enhanced data interoperability and reusability, positioning it as a promising tool to improve clinical research and accelerate drug development.
- Abstract(参考訳): 歴史的臨床試験データの再利用は、医学研究と薬物開発を加速する大きな可能性を秘めている。
しかし、特に医療コードの欠如による相互運用性の課題は、研究全体にわたる効果的なデータ統合を妨げる。
大きな言語モデル(LLMs)はラベル付きデータなしで自動化されたコーディングのための有望なソリューションを提供するが、現在のアプローチは複雑なコーディングタスクにおいて課題に直面している。
自動ゼロショット医療符号化のための新しい合成LLMシステムであるALIGNを紹介する。
ALIGNは,(1)多様な候補コード生成,(2)コードの自己評価,(3)信頼度評価,不確実性推定という3段階のプロセスを踏襲し,信頼性を確保する。
治療薬用語を解剖学的治療薬(ATC)に調和させる上でのALIGNを,22の免疫学的試験から抽出したMedDRA(Medicical Dictionary for Regulatory Activity, MedDRA)コードに評価した。
ALIGNはLLMのベースラインを上回り、信頼性の高いデプロイメントの能力も提供した。
MedDRA符号化では、ALIGNは全レベルにわたって高い精度を達成し、RAGに適合し、最も具体的なレベル(HLGTは87-90%)で優れている。
ALIGNはATCレベル4の下位階層において, 72~73%の精度, 86~89%の精度で, ベースラインを7~22%上回った。
ALIGNの不確実性に基づく脱フェラルは、30%の脱フェラルで精度を17%から90%向上させた。
ALIGNは、GPT-4o-miniおよびGPT-4oのコード当たり0.0007および0.02の費用効率でこれを達成し、臨床導入の障壁を減らす。
ALIGNは、臨床試験データのための自動医療コーディングを進歩させ、データの相互運用性と再利用性の向上に貢献し、臨床研究を改善し、薬物開発を加速する有望なツールとして位置づけている。
関連論文リスト
- Novel Development of LLM Driven mCODE Data Model for Improved Clinical Trial Matching to Enable Standardization and Interoperability in Oncology Research [0.15346678870160887]
がんの費用は2023年だけで2080億ドルを超える。
腫瘍学における臨床試験および臨床医療に関する伝統的な手法は、しばしば手作業、時間、データ駆動アプローチの欠如である。
本稿では,がん領域の標準化,相互運用,交換を効率化するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-10-18T17:31:35Z) - MedCodER: A Generative AI Assistant for Medical Coding [3.7153274758003967]
我々は、自動医療コーディングのためのジェネレーティブAIフレームワークであるMedCodERを紹介する。
MedCodERは、ICD(International Classification of Diseases)コード予測において、マイクロF1スコアの0.60を達成している。
疾患診断,ICD符号,エビデンステキストを付加した医療記録を含む新しいデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-18T19:36:33Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - Large language models are good medical coders, if provided with tools [0.0]
本研究は,ICD-10-CM自動医療符号化のための2段階リトリーブ・ランクシステムを提案する。
両方のシステムを100の単一長期医療条件のデータセットで評価する。
Retrieve-Rank システムは正しい ICD-10-CM 符号の予測において100%の精度を達成した。
論文 参考訳(メタデータ) (2024-07-06T06:58:51Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Collaborative residual learners for automatic icd10 prediction using
prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。
平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文 参考訳(メタデータ) (2020-12-16T07:07:27Z) - Multi-label natural language processing to identify diagnosis and
procedure codes from MIMIC-III inpatient notes [0.0]
米国では、医療用コードや請求書を含む管理費として、病院支出の25%以上を計上している。
自然言語処理は、構造化されていない臨床ノートからコードやラベルの抽出を自動化することができる。
我々のモデルは、87.08%、F1スコア85.82%、AUC91.76%をトップ10コードで達成した。
論文 参考訳(メタデータ) (2020-03-17T02:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。