Fugu-MT 論文翻訳(概要): Large language models are good medical coders, if provided with tools

論文の概要: Large language models are good medical coders, if provided with tools

arxiv url: http://arxiv.org/abs/2407.12849v1
Date: Sat, 6 Jul 2024 06:58:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-22 08:28:07.057437
Title: Large language models are good medical coders, if provided with tools
Title（参考訳）: 大規模言語モデルは優れた医療用コーダーであり、もしツールが備わっているなら
Authors: Keith Kwan,
Abstract要約: 本研究は,ICD-10-CM自動医療符号化のための2段階リトリーブ・ランクシステムを提案する。両方のシステムを100の単一長期医療条件のデータセットで評価する。 Retrieve-Rank システムは正しい ICD-10-CM 符号の予測において100%の精度を達成した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study presents a novel two-stage Retrieve-Rank system for automated ICD-10-CM medical coding, comparing its performance against a Vanilla Large Language Model (LLM) approach. Evaluating both systems on a dataset of 100 single-term medical conditions, the Retrieve-Rank system achieved 100% accuracy in predicting correct ICD-10-CM codes, significantly outperforming the Vanilla LLM (GPT-3.5-turbo), which achieved only 6% accuracy. Our analysis demonstrates the Retrieve-Rank system's superior precision in handling various medical terms across different specialties. While these results are promising, we acknowledge the limitations of using simplified inputs and the need for further testing on more complex, realistic medical cases. This research contributes to the ongoing effort to improve the efficiency and accuracy of medical coding, highlighting the importance of retrieval-based approaches.
Abstract（参考訳）: 本研究では,CD-10-CM自動医療符号化のための2段階リトリーブ・ランクシステムについて,その性能をVanilla Large Language Model (LLM)アプローチと比較した。 Retrieve-Rankシステムは、100の単一長期医療条件のデータセット上で両方のシステムを評価することで、正しいICD-10-CMコードを予測する精度を100%達成し、わずか6%の精度でVanilla LLM(GPT-3.5-turbo)をはるかに上回った。分析の結果,Retrieve-Rank システムは様々な専門分野の医療用語を扱う上で,より高精度であることがわかった。これらの結果は有望なものだが、簡易な入力の使用の限界と、より複雑で現実的な医療症例に対するさらなるテストの必要性を認めている。本研究は, 医用符号化の効率化と精度向上に寄与し, 検索手法の重要性を浮き彫りにしている。

関連論文リスト

Evaluating Hierarchical Clinical Document Classification Using Reasoning-Based LLMs [7.026393789313748]
本研究は,大規模言語モデル(LLM)が病院退院サマリーからICD-10コードをどのように分類できるかを評価する。推論ベースのモデルは一般的に非推論モデルよりも優れており、ジェミニ2.5 Proは全体として最高のパフォーマンスを示した。
論文参考訳（メタデータ） (2025-07-02T00:53:54Z)
RuCCoD: Towards Automated ICD Coding in Russian [38.98810919082103]
我々は1万以上のエンティティと1500以上のユニークなICDコードで注釈付けされたICD符号化のための新しいデータセットを提案する。このデータセットは、BERT、LLaMA with LoRA、RAGなど、最先端モデルのベンチマークとして機能する。本実験は, 自動予測符号によるトレーニングが, 医師による手作業による注記データと比較して, 精度を大幅に向上することを示した。
論文参考訳（メタデータ） (2025-02-28T17:40:24Z)
Adaptive Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge [6.977177904883792]
AMG-RAGは、医療知識グラフの構築と継続的な更新を自動化する包括的なフレームワークである。推論を統合し、PubMedやWikiSearchといった現在の外部証拠を検索する。 MEDQAのF1スコアは74.1%、MEDMCQAの精度は66.34パーセントで、同等のモデルと10倍から100倍のモデルの両方を上回っている。
論文参考訳（メタデータ） (2025-02-18T16:29:45Z)
Unlocking Historical Clinical Trial Data with ALIGN: A Compositional Large Language Model System for Medical Coding [44.01429184037945]
自動ゼロショット医療符号化のための新しい合成LLMシステムであるALIGNを紹介する。我々は、ALIGNを解剖学的治療化学(ATC)と医学史用語に調和させ、MedDRA(Medicical Dictionary for Regulatory Activity)コードに評価した。
論文参考訳（メタデータ） (2024-11-20T09:59:12Z)
Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering [70.44269982045415]
Retrieval-augmented Generation (RAG) は,大規模言語モデル (LLM) の性能向上のための有望なアプローチとして登場した。医療用QAデータセットに様々な補助的要素を提供するMedRGB(MedRGB)を導入する。実験結果から,検索した文書のノイズや誤情報の処理能力に限界があることが判明した。
論文参考訳（メタデータ） (2024-11-14T06:19:18Z)
Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。 MIMIC-IIIでは最大10.8～15.0%、MIMIC-IVでは12.6～12.7%である。
論文参考訳（メタデータ） (2024-10-06T18:46:28Z)
MedCodER: A Generative AI Assistant for Medical Coding [3.7153274758003967]
我々は、自動医療コーディングのためのジェネレーティブAIフレームワークであるMedCodERを紹介する。 MedCodERは、ICD(International Classification of Diseases)コード予測において、マイクロF1スコアの0.60を達成している。疾患診断,ICD符号,エビデンステキストを付加した医療記録を含む新しいデータセットを提案する。
論文参考訳（メタデータ） (2024-09-18T19:36:33Z)
Exploring LLM Multi-Agents for ICD Coding [15.730751450511333]
ICD符号化のためのマルチエージェント方式は実世界の符号化プロセスを効果的に模倣し、一般的な符号と稀な符号の両方の性能を向上させる。提案手法は, 事前学習や微調整を必要とする最先端のICD符号化手法に匹敵する結果を得るとともに, 稀なコード精度, 説明可能性で性能を向上する。
論文参考訳（メタデータ） (2024-04-01T15:17:39Z)
Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文参考訳（メタデータ） (2023-04-21T11:54:44Z)
Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文参考訳（メタデータ） (2022-05-19T17:34:18Z)
Collaborative residual learners for automatic icd10 prediction using prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文参考訳（メタデータ） (2020-12-16T07:07:27Z)
Ensemble model for pre-discharge icd10 coding prediction [45.82374977939355]
正確なコード予測のための複数の臨床データソースを組み込んだアンサンブルモデルを提案する。平均精度は0.73および0.58、F1スコアは0.56および0.35、患者および外来データセットの主診断予測では0.71および0.4のマルチラベル分類精度を得る。
論文参考訳（メタデータ） (2020-12-16T07:02:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。