論文の概要: Human or LLM as Standardized Patients? A Comparative Study for Medical Education
- arxiv url: http://arxiv.org/abs/2511.14783v1
- Date: Wed, 12 Nov 2025 11:05:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.439923
- Title: Human or LLM as Standardized Patients? A Comparative Study for Medical Education
- Title(参考訳): 標準化患者としての人間とLLM : 医学教育における比較研究
- Authors: Bingquan Zhang, Xiaoxiao Liu, Yuchi Wang, Lei Zhou, Qianqian Xie, Benyou Wang,
- Abstract要約: EasyMEDは、現実的な対話のための患者エージェント、現実的な一貫性のための補助エージェント、実用的なフィードバックを提供する評価エージェントを組み合わせたマルチエージェントフレームワークである。
実験により,EasyMEDは人間のSP学習結果と一致し,低ベースラインの学生により大きなスキル向上をもたらすことが示された。
- 参考スコア(独自算出の注目度): 39.27963569219533
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Standardized Patients (SP) are indispensable for clinical skills training but remain expensive, inflexible, and difficult to scale. Existing large-language-model (LLM)-based SP simulators promise lower cost yet show inconsistent behavior and lack rigorous comparison with human SP. We present EasyMED, a multi-agent framework combining a Patient Agent for realistic dialogue, an Auxiliary Agent for factual consistency, and an Evaluation Agent that delivers actionable feedback. To support systematic assessment, we introduce SPBench, a benchmark of real SP-doctor interactions spanning 14 specialties and eight expert-defined evaluation criteria. Experiments demonstrate that EasyMED matches human SP learning outcomes while producing greater skill gains for lower-baseline students and offering improved flexibility, psychological safety, and cost efficiency.
- Abstract(参考訳): 標準化患者(SP)は臨床技能訓練に欠かせないが、高価で柔軟性がなく、拡張が困難である。
既存の大言語モデル(LLM)ベースのSPシミュレータは、コストの低減を約束するが、一貫性のない振る舞いを示し、人間SPと厳密な比較をしていない。
本稿では,現実的な対話のための患者エージェント,現実的な一貫性のための補助エージェント,実用的なフィードバックを提供する評価エージェントを組み合わせたマルチエージェントフレームワークEasyMEDを提案する。
本研究では,14の専門分野と8つの専門家定義評価基準にまたがる実SP-ドクター相互作用のベンチマークであるSPBenchを紹介する。
実験により、EasyMEDは人間のSP学習結果と一致し、低ベースラインの学生により大きなスキル向上をもたらし、柔軟性、心理的安全性、コスト効率を改善した。
関連論文リスト
- An Agentic AI Framework for Training General Practitioner Student Skills [1.8865968025608468]
本稿では,一般学生のスキルを育成するためのエージェント・フレームワークを紹介し,エビデンスベースのビグネット生成,人格主導型患者対話,標準に基づく評価とフィードバックについて紹介する。
参加者は、現実的でヴィグネットに忠実な対話、適切な難易度調整、安定した性格信号、非常に有用なサンプルリッチフィードバックを報告した。
これらの結果は,信頼性と教育学的に価値のあるトレーニングツールを構築するための実践的パターンとして,シナリオ制御,インタラクション制御,標準に基づく評価のエージェント的分離を支援する。
論文 参考訳(メタデータ) (2025-12-20T17:26:39Z) - DischargeSim: A Simulation Benchmark for Educational Doctor-Patient Communication at Discharge [11.081999875352025]
退院コミュニケーションは、患者のケアにおいて重要だが未発見の要素である。
モデルがパーソナライズされた放電教育者として機能する能力を評価する新しいベンチマークであるDesignSimを紹介する。
論文 参考訳(メタデータ) (2025-09-08T20:07:30Z) - Reframe Your Life Story: Interactive Narrative Therapist and Innovative Moment Assessment with Large Language Models [72.36715571932696]
物語療法は、個人が問題のある人生の物語を代替品の力に変えるのに役立つ。
現在のアプローチでは、特殊精神療法ではリアリズムが欠如しており、時間とともに治療の進行を捉えることができない。
Int(Interactive Narrative Therapist)は、治療段階を計画し、反射レベルを誘導し、文脈的に適切な専門家のような反応を生成することによって、専門家の物語セラピストをシミュレートする。
論文 参考訳(メタデータ) (2025-07-27T11:52:09Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - LLMs Can Simulate Standardized Patients via Agent Coevolution [8.539733225671059]
標準化された患者(SP)を用いた医療従事者の養成は、依然として複雑な課題である。
EvoPatientは、患者エージェントと医師エージェントがマルチターン対話を通じて診断プロセスをシミュレートする、新しいシミュレートされた患者フレームワークである。
我々のフレームワークは、既存の推論手法を10%以上改善し、要求アライメントと人間の嗜好を改善する。
論文 参考訳(メタデータ) (2024-12-16T12:36:47Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Leveraging Large Language Model as Simulated Patients for Clinical Education [18.67200160979337]
高いトレーニングコストと有資格SPは、この種の臨床訓練への学生のアクセスを制限する。
LLM(Large Language Models)の急速な発展に伴い、対話型人工知能とロールプレイングにおける特有な能力が実証された。
臨床医学教育におけるLLMの可能性を生かしたCureFunと呼ばれる統合型モデル診断フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-13T06:36:32Z) - Automatic Interactive Evaluation for Large Language Models with State Aware Patient Simulator [21.60103376506254]
大きな言語モデル(LLM)は、人間の相互作用において顕著な熟練性を示している。
本稿では,SAPS(State-Aware patient Simulator)とAIE(Automated Interactive Evaluation)フレームワークを紹介する。
AIEとSAPSは、多ターン医師-患者シミュレーションを通じてLCMを評価するための動的で現実的なプラットフォームを提供する。
論文 参考訳(メタデータ) (2024-03-13T13:04:58Z) - ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate [57.71597869337909]
われわれはChatEvalと呼ばれるマルチエージェントの審判チームを構築し、異なるモデルから生成された応答の品質を自律的に議論し評価する。
分析の結果,ChatEvalは単なるテキストスコアリングを超越し,信頼性評価のための人間模倣評価プロセスを提供することがわかった。
論文 参考訳(メタデータ) (2023-08-14T15:13:04Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。