論文の概要: Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks
- arxiv url: http://arxiv.org/abs/2603.06902v1
- Date: Fri, 06 Mar 2026 21:42:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.389271
- Title: Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks
- Title(参考訳): 局所展開型医療エージェントの高度化とFHIRによる臨床応用
- Authors: Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi,
- Abstract要約: State-Enhanced Logical-Skill Memory (SELSM) は、シミュレートされた臨床軌道をエンティティに依存しない運用ルールに蒸留する、トレーニング不要のフレームワークである。
MedAgentBench - 実際の臨床データでベンチマークされた唯一の信頼性の高い高忠実な仮想EHRサンドボックス。
- 参考スコア(独自算出の注目度): 15.634158040789474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Large Language Models demonstrate immense potential as proactive Medical Agents, their real-world deployment is severely bottlenecked by data scarcity under privacy constraints. To overcome this, we propose State-Enhanced Logical-Skill Memory (SELSM), a training-free framework that distills simulated clinical trajectories into entity-agnostic operational rules within an abstract skill space. During inference, a Query-Anchored Two-Stage Retrieval mechanism dynamically fetches these entity-agnostic logical priors to guide the agent's step-by-step reasoning, effectively resolving the state polysemy problem. Evaluated on MedAgentBench -- the only authoritative high-fidelity virtual EHR sandbox benchmarked with real clinical data -- SELSM substantially elevates the zero-shot capabilities of locally deployable foundation models (30B--32B parameters). Notably, on the Qwen3-30B-A3B backbone, our framework completely eliminates task chain breakdowns to achieve a 100\% completion rate, boosting the overall success rate by an absolute 22.67\% and significantly outperforming existing memory-augmented baselines. This study demonstrates that equipping models with a dynamically updatable, state-enhanced cognitive scaffold is a privacy-preserving and computationally efficient pathway for local adaptation of AI agents to clinical information systems. While currently validated on FHIR-based EHR interactions as an initial step, the entity-agnostic design of SELSM provides a principled foundation toward broader clinical deployment.
- Abstract(参考訳): 大規模言語モデルは、プロアクティブな医療エージェントとして大きな可能性を秘めているが、彼らの実世界の展開は、プライバシー制約の下でデータ不足によって著しくボトルネックになっている。
これを解決するために, シミュレーションされた臨床軌道を抽象的スキル空間内のエンティティに依存しない運用ルールに蒸留する, トレーニング不要なフレームワークであるState-Enhanced Logical-Skill Memory (SELSM)を提案する。
推論中、Query-Anchored Two-Stage Retrievalメカニズムは、エージェントのステップバイステップ推論をガイドするために、エンティティに依存しない論理的優先順位を動的に取得し、状態のポリセミー問題を効果的に解決する。
MedAgentBench - 実際の臨床データでベンチマークされた唯一の信頼性の高い仮想EHRサンドボックスで、SELSMは、ローカルにデプロイ可能な基礎モデル(30B-32Bパラメータ)のゼロショット能力を大幅に高めている。
特に,Qwen3-30B-A3Bのバックボーンでは,タスクチェーンの故障を完全に排除して100倍の完了率を実現し,総成功率を22.67倍に向上させ,既存のメモリ拡張ベースラインを著しく上回っている。
本研究は,AIエージェントを臨床情報システムに局所的に適応するためのプライバシ保存的かつ計算的に効率的な経路として,動的にアップグレード可能な認知足場を備えたモデルの装備を実証する。
現在、初期段階としてFHIRベースの EHR の相互作用が検証されているが、SELSM の実体に依存しない設計は、より広範な臨床展開に向けた原則的な基盤を提供する。
関連論文リスト
- EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - AgentEHR: Advancing Autonomous Clinical Decision-Making via Retrospective Summarization [28.032865974227875]
RetroSumは、レトロスペクティブの要約メカニズムと進化するエクスペリエンス戦略を統合するフレームワークである。
競争ベースラインよりも29.16%のパフォーマンス向上を実現し、全体のインタラクションエラーを92.3%まで大幅に削減した。
論文 参考訳(メタデータ) (2026-01-20T12:48:04Z) - Bridging the Knowledge-Action Gap by Evaluating LLMs in Dynamic Dental Clinical Scenarios [9.865786198063644]
受動的知識検索装置から自律的臨床エージェントへの大規模言語モデル(LLM)の移行は、静的精度から動的行動信頼性への評価のシフトを要求する。
本研究は, 歯科用LLMの能力境界を実証的に表し, 標準化された知識と安全で自律的な臨床実践のギャップを埋めるためのロードマップを提供する。
論文 参考訳(メタデータ) (2026-01-19T11:36:39Z) - From Performance to Practice: Knowledge-Distilled Segmentator for On-Premises Clinical Workflows [8.438143117044795]
本稿では,高パフォーマンスセグメンテーションモデルを拡張性のあるコンパクトな学生モデルファミリに変換するためのデプロイメント指向フレームワークを提案する。
提案手法は,既存の臨床システムとのアーキテクチャ互換性を維持しつつ,体系的な容量削減を実現している。
その結果、知識蒸留は、研究グレードのセグメンテーションモデルを保守可能で展開可能なコンポーネントに変換するための実用的で信頼性の高い経路を提供することを示した。
論文 参考訳(メタデータ) (2026-01-14T05:44:30Z) - Bio-inspired Agentic Self-healing Framework for Resilient Distributed Computing Continuum Systems [4.003029907200818]
ReCiStは、分散コンピューティング継続システム(DCCS)のレジリエンスを実現するために設計された、バイオインスパイアされたエージェントによる自己修復フレームワークである。
ReCiStは、止血、炎症、増殖、再生の生物学的フェーズを、DCCSの包含、診断、メタ認知、知識の計算層に再構築する。
これら4つのレイヤは、自律的な障害分離、因果診断、適応的回復、言語モデル(LM)を利用した長期的な知識統合を行う。
論文 参考訳(メタデータ) (2026-01-01T13:30:38Z) - Bridging VLMs and Embodied Intelligence with Deliberate Practice Policy Optimization [72.20212909644017]
Deliberate Practice Policy Optimization (DPPO) はメタ認知型メタループのトレーニングフレームワークである。
DPPOは教師付き微調整(能力拡張)と強化学習(技能向上)の交互に行う
実証的には、DPPO(Pelican-VL 1.0)で視覚言語を具現化したモデルをトレーニングすると、ベースモデルよりも20.3%パフォーマンスが向上する。
私たちはモデルとコードをオープンソースにして、データとリソースのボトルネックを軽減する最初の体系的なフレームワークを提供しています。
論文 参考訳(メタデータ) (2025-11-20T17:58:04Z) - Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - Representation Learning of Lab Values via Masked AutoEncoders [2.785172582119726]
逐次的な実験値の計算のためのトランスフォーマーベースのマスク付きオートエンコーダフレームワークであるLab-MAEを提案する。
Lab-MAEは、患者の人口集団間で同等のパフォーマンスを達成し、臨床予測において公平性を向上させる。
論文 参考訳(メタデータ) (2025-01-05T20:26:49Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence [68.05876437208505]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。