論文の概要: MedPAO: A Protocol-Driven Agent for Structuring Medical Reports
- arxiv url: http://arxiv.org/abs/2510.04623v1
- Date: Mon, 06 Oct 2025 09:32:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.777135
- Title: MedPAO: A Protocol-Driven Agent for Structuring Medical Reports
- Title(参考訳): MedPAO: 医療報告の構造化のためのプロトコル駆動エージェント
- Authors: Shrish Shrinath Vaidya, Gowthamaan Palani, Sidharth Ramesh, Velmurugan Balasubramanian, Minmini Selvam, Gokulraja Srinivasaraja, Ganapathy Krishnamurthi,
- Abstract要約: 我々は、精度と検証可能な推論を保証する新しいエージェントフレームワークであるMedPAOを紹介する。
MedPAOは、レポート構造化タスクをPlan-Act-Observe (PAO)ループと特殊なツールによって管理される透明なプロセスに分解する。
MedPAOは概念分類の重要なサブタスクに対して0.96のF1スコアを達成する。
- 参考スコア(独自算出の注目度): 0.13029689752120577
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The deployment of Large Language Models (LLMs) for structuring clinical data is critically hindered by their tendency to hallucinate facts and their inability to follow domain-specific rules. To address this, we introduce MedPAO, a novel agentic framework that ensures accuracy and verifiable reasoning by grounding its operation in established clinical protocols such as the ABCDEF protocol for CXR analysis. MedPAO decomposes the report structuring task into a transparent process managed by a Plan-Act-Observe (PAO) loop and specialized tools. This protocol-driven method provides a verifiable alternative to opaque, monolithic models. The efficacy of our approach is demonstrated through rigorous evaluation: MedPAO achieves an F1-score of 0.96 on the critical sub-task of concept categorization. Notably, expert radiologists and clinicians rated the final structured outputs with an average score of 4.52 out of 5, indicating a level of reliability that surpasses baseline approaches relying solely on LLM-based foundation models. The code is available at: https://github.com/MiRL-IITM/medpao-agent
- Abstract(参考訳): 臨床データ構築のためのLarge Language Models(LLMs)の展開は、事実を幻覚させる傾向とドメイン固有のルールに従うことができないことによって著しく妨げられている。
そこで本研究では,CXR解析のためのABCDEFプロトコルなどの確立された臨床プロトコルにおいて,その動作を基盤として,正確かつ検証可能な推論を実現する新しいエージェントフレームワークであるMedPAOを紹介する。
MedPAOは、レポート構造化タスクをPlan-Act-Observe (PAO)ループと特殊なツールによって管理される透明なプロセスに分解する。
このプロトコル駆動方式は不透明でモノリシックなモデルに代わる検証可能な代替手段を提供する。
MedPAOは概念分類の重要なサブタスクに対して0.96のF1スコアを達成する。
専門の放射線学者や臨床医は、最終構成出力を5点中平均スコア4.52点と評価し、LCMベースの基礎モデルのみに依存するベースラインアプローチを超える信頼性のレベルを示した。
コードは、https://github.com/MiRL-IITM/medpao-agent.comで入手できる。
関連論文リスト
- Can Molecular Foundation Models Know What They Don't Know? A Simple Remedy with Preference Optimization [54.22711328577149]
既存の基盤モデルと柔軟に統合可能なプラグイン・アンド・プレイモジュールである,分子適応型参照インスタンスランキング(Mole-PAIR)を導入する。
本手法は既存の分子基盤モデルのOOD検出能力を著しく向上することを示す。
論文 参考訳(メタデータ) (2025-09-29T21:06:52Z) - An Automated Retrieval-Augmented Generation LLaMA-4 109B-based System for Evaluating Radiotherapy Treatment Plans [2.2532577733932038]
我々は,LLaMA-4 109Bを用いた放射線治療計画の自動化,プロトコル認識,解釈可能な評価のためのRAGシステムを開発した。
RAGシステムは5つのSentenceTransformerバックボーンに最適化された検索エンジン、コホート類似性に基づくパーセンタイル予測コンポーネント、臨床制約チェッカーの3つのコアモジュールを統合している。
論文 参考訳(メタデータ) (2025-09-25T03:18:31Z) - Model selection meets clinical semantics: Optimizing ICD-10-CM prediction via LLM-as-Judge evaluation, redundancy-aware sampling, and section-aware fine-tuning [1.208527102371119]
ICD-10(ICD-10-CM)コード予測のためのモジュラーフレームワークを提案する。
モデル選択の原則、冗長性を認識したデータサンプリング、構造化された入力設計による課題に対処する。
提案するフレームワークは、自動化された医療コーディングシステムの現実的な展開に対して、スケーラブルで機関対応のソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-23T09:35:05Z) - Medical AI Consensus: A Multi-Agent Framework for Radiology Report Generation and Evaluation [0.2039123720459736]
放射線学のエコシステムにおけるマルチモーダルな臨床推論のためのベンチマークおよび評価環境として機能するマルチエージェント強化学習フレームワークを提案する。
提案フレームワークは,画像解析,特徴抽出,レポート生成,レビュー,評価を担当する10の特殊エージェントからなるモジュールアーキテクチャにおいて,大規模言語モデル(LLM)と大規模ビジョンモデル(LVM)を統合する。
論文 参考訳(メタデータ) (2025-09-22T04:31:27Z) - An Agentic Model Context Protocol Framework for Medical Concept Standardization [5.12407270785129]
モデルコンテキストプロトコル(MCP)に基づくゼロトレーニング・幻覚防止マッピングシステムの開発
このシステムは説明可能なマッピングを可能にし、最小限の労力で効率と精度を大幅に改善する。
論文 参考訳(メタデータ) (2025-09-04T02:32:22Z) - When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs [55.20230501807337]
本報告では, 統一実験フレームワーク内での迅速なロバスト性向上のための5つの手法の体系的評価を行う。
Llama、Qwen、Gemmaファミリーの8つのモデルに対して、Natural Instructionsデータセットから52のタスクをベンチマークする。
論文 参考訳(メタデータ) (2025-08-15T10:32:50Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - How Well Can Modern LLMs Act as Agent Cores in Radiology Environments? [54.36730060680139]
RadA-BenchPlatは、放射線学環境での大規模言語モデル(LLM)のパフォーマンスをベンチマークする評価プラットフォームである。
また、エージェント駆動型タスク解決ツールの10のカテゴリを定義し、7つの主要なLCMを評価している。
論文 参考訳(メタデータ) (2024-12-12T18:20:16Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。