論文の概要: Are LLMs Ready to Assist Physicians? PhysAssistBench for Interactive Doctor-Patient-EHR Assistance
- arxiv url: http://arxiv.org/abs/2606.18613v2
- Date: Thu, 18 Jun 2026 12:19:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 13:55:51.806333
- Title: Are LLMs Ready to Assist Physicians? PhysAssistBench for Interactive Doctor-Patient-EHR Assistance
- Title(参考訳): LLMは医師を援助する準備が整っているか? : 医師とEHRの対話的支援のためのPhysAssistBench
- Authors: Tianming Du, Peijie Yu, Sihan Shang, Danli Shi, My Linh Nguyen, Shengbo Gao, Guangyuan Li, Yinghong Yu, Yan Jiang, Qianlong Zhao, Behzad Bozorgtabar, Shaoxiong Ji, Jiazhen Pan, Daniel Rueckert, Jiancheng Yang,
- Abstract要約: PhysAssistBenchは、インタラクティブな医師・患者・EHR支援のためのベンチマークである。
実際のMIMIC-IVケースから構築されたPhysAssistBenchは、スケーラブルなパイプラインを使用して、エージェント患者を構築する。
PhysAssistBenchは、手動でレビューされた1,296回と医師公認のターンのキュレートされた評価セットを提供する。
- 参考スコア(独自算出の注目度): 35.00060523691334
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The most plausible near-term role of medical LLMs is to assist rather than replace physicians, yet current evaluations often test isolated capabilities: clinical knowledge, EHR system interaction, or patient communication. Physician assistance instead requires coordinating these capabilities within the same interaction, where physicians issue underspecified requests, patients describe symptoms ambiguously, and EHR systems demand precise tool use. We introduce PhysAssistBench, a benchmark for interactive doctor-patient-EHR assistance. Built from real MIMIC-IV cases, PhysAssistBench uses a scalable pipeline to construct agentic patients: interactive, record-grounded agents that turn static EHR records into multi-turn clinical scenarios while preserving clinical factuality. PhysAssistBench provides a curated bilingual evaluation set of 1,296 manually reviewed and physician-validated turns. Experiments with leading LLMs show that current models remain unreliable in this setting, which exposes a key bottleneck for clinical LLMs: reliable assistance requires coordination across knowledge, communication, and systems, not isolated gains in any of them.
- Abstract(参考訳): 医学 LLM の最も確実な短期的役割は、医師の代わりに支援することであるが、現在の評価では、臨床知識、ERHシステムインタラクション、患者とのコミュニケーションといった孤立した能力をテストすることがしばしばある。
医師は、医師が不明確な要求を発行し、患者は症状をあいまいに説明し、EHRシステムは正確なツールの使用を要求する。
PhysAssistBenchは、インタラクティブな医師・患者・EHR支援のためのベンチマークである。
PhysAssistBenchはMIMIC-IVの実際のケースから構築され、スケーラブルなパイプラインを使用してエージェント患者を構築する。
PhysAssistBenchは、手動でレビューした1,296のバイリンガル評価セットと医師公認のターンを提供する。
信頼できる補助には知識、コミュニケーション、システム間の協調が必要であるが、いずれのモデルにおいても孤立した利益は得られない。
関連論文リスト
- Enabling Doctor-Centric Medical AI with LLMs through Workflow-Aligned Tasks and Benchmarks [72.89088985703748]
大きな言語モデル(LLM)の台頭は、臨床ガイダンスを提供することで医療に変化をもたらしたが、患者への直接の展開は安全性のリスクをもたらす。
我々は,患者と直接対話するのではなく,経験豊富な医師と協力する臨床助手としてLLMを再配置することを提案する。
我々は、22の臨床的タスクと27の専門分野にわたる92,000のQ&Aインスタンスからなる大規模な中国の医療データセットであるDoctorFLANを構築した。
論文 参考訳(メタデータ) (2025-10-13T06:18:27Z) - MedSyn: Enhancing Diagnostics with Human-AI Collaboration [19.23358929400838]
大言語モデル(LLM)は、臨床意思決定を支援するためのツールとして有望であることを示している。
我々は、医師とLLMが多段階の対話を行い、診断と治療の決定を洗練するためのハイブリッドなヒューマンAIフレームワーク、MedSynを提案する。
論文 参考訳(メタデータ) (2025-05-07T09:37:18Z) - Ask Patients with Patience: Enabling LLMs for Human-Centric Medical Dialogue with Grounded Reasoning [25.068780967617485]
大規模言語モデル(LLM)は潜在的な解決策を提供するが、現実の臨床的相互作用に苦慮する。
Ask patients with Patience (APP) は,基礎的推論,透明な診断,人間中心のインタラクションを目的とした多ターンLCMベースの医療アシスタントである。
APPは共感的対話を通じてユーザ症状を誘発することでコミュニケーションを強化し、アクセシビリティとユーザエンゲージメントを大幅に改善する。
論文 参考訳(メタデータ) (2025-02-11T00:13:52Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。