論文の概要: Benchmarking Large Language Models on Communicative Medical Coaching: a
Novel System and Dataset
- arxiv url: http://arxiv.org/abs/2402.05547v1
- Date: Thu, 8 Feb 2024 10:32:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 15:41:34.330353
- Title: Benchmarking Large Language Models on Communicative Medical Coaching: a
Novel System and Dataset
- Title(参考訳): コミュニケーション型医療コーチングにおける大規模言語モデルのベンチマーク:新しいシステムとデータセット
- Authors: Hengguan Huang, Songtao Wang, Hongfu Liu, Hao Wang and Ye Wang
- Abstract要約: 統合された人間-AI協調フレームワークChatCoach'を紹介する。
患者エージェントとコーチングエージェントは、医療コミュニケーションスキルの実践において、医療学習者を協調的に支援する。
比較分析の結果,Llama2はChatGPTのプロンプトベースアプローチよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 28.435148148156706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional applications of natural language processing (NLP) in healthcare
have predominantly focused on patient-centered services, enhancing patient
interactions and care delivery, such as through medical dialogue systems.
However, the potential of NLP to benefit inexperienced doctors, particularly in
areas such as communicative medical coaching, remains largely unexplored. We
introduce ``ChatCoach,'' an integrated human-AI cooperative framework. Within
this framework, both a patient agent and a coaching agent collaboratively
support medical learners in practicing their medical communication skills
during consultations. Unlike traditional dialogue systems, ChatCoach provides a
simulated environment where a human doctor can engage in medical dialogue with
a patient agent. Simultaneously, a coaching agent provides real-time feedback
to the doctor. To construct the ChatCoach system, we developed a dataset and
integrated Large Language Models such as ChatGPT and Llama2, aiming to assess
their effectiveness in communicative medical coaching tasks. Our comparative
analysis demonstrates that instruction-tuned Llama2 significantly outperforms
ChatGPT's prompting-based approaches.
- Abstract(参考訳): 医療における自然言語処理(NLP)の伝統的な応用は、主に患者中心のサービスに焦点を合わせており、医療対話システムなどを通じて患者との対話やケア提供を促進する。
しかし、NLPが経験の浅い医師に利益をもたらす可能性、特にコミュニケーション・メディカル・コーチングなどの分野では明らかにされていない。
統合型AI協調フレームワークである 'ChatCoach' を紹介する。
この枠組み内では、患者エージェントとコーチングエージェントの両方が、相談中の医療コミュニケーションスキルを実践する医療学習者を支援する。
従来の対話システムとは異なり、ChatCoachは、医師が患者エージェントと医療対話を行うことができるシミュレーション環境を提供する。
同時に、コーチングエージェントが医師にリアルタイムのフィードバックを提供する。
そこで我々はChatCoachシステムを構築するために,ChatGPTやLlama2といった大規模言語モデルを統合したデータセットを開発し,コミュニケーション型医療コーチングタスクの有効性を評価する。
比較分析の結果,Llama2はChatGPTのプロンプトベースアプローチよりも優れていることがわかった。
関連論文リスト
- RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.91736546490813]
本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-22T17:44:40Z) - Synthetic Patients: Simulating Difficult Conversations with Multimodal Generative AI for Medical Education [0.0]
効果的な患者中心コミュニケーションは、医師にとって重要な能力である。
調味剤提供者と医療研修生の双方は、センシティブな話題に関する会話をリードする自信を減らした。
本稿では,ビデオによる会話の対話的リアルタイムシミュレーションを支援するための,新しい教育ツールを提案する。
論文 参考訳(メタデータ) (2024-05-30T11:02:08Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Healthcare Copilot: Eliciting the Power of General LLMs for Medical
Consultation [96.22329536480976]
医療相談用に設計された医療コパイロットの構築について紹介する。
提案した医療コパイロットは,(1)効果的で安全な患者との対話に責任を負う対話コンポーネント,2)現在の会話データと過去の患者情報の両方を記憶する記憶コンポーネント,3)処理コンポーネント,そして,対話全体を要約し,報告を生成する。
提案したヘルスケア・コパイロットを評価するために,ChatGPT を用いた仮想患者とコーピロとの対話を行う仮想患者と,対話の質を評価するための評価器の2つの役割を自動評価する手法を実装した。
論文 参考訳(メタデータ) (2024-02-20T22:26:35Z) - Validating a virtual human and automated feedback system for training
doctor-patient communication skills [3.0354760313198796]
本稿では,SOPHIE(Standardized Online patient for Health Interaction Education)として知られる,スケーラブルでアクセスしやすいデジタルツールの開発と検証について紹介する。
その結果,SOPHIEを施行した被験者は,コミュニケーション全体,集計スコア,患者のエンパワーメント,共感などのコントロールよりも有意に優れていた。
いつか、SOPHIEが既存のリソースを補完するスケーラブルなオプションを提供することで、コミュニケーショントレーニングリソースをよりアクセスしやすくすることを期待します。
論文 参考訳(メタデータ) (2023-06-27T05:23:08Z) - PlugMed: Improving Specificity in Patient-Centered Medical Dialogue
Generation using In-Context Learning [20.437165038293426]
患者中心の医療対話システムは、医療知識に乏しいユーザーに診断解釈サービスを提供しようとしている。
大きな言語モデル(LLM)では、期待できる性能にもかかわらず応答の特異性を保証することは困難である。
In-context Learning に触発されて,プラグイン・アンド・プレイ医療対話システム PlugMed を提案する。
論文 参考訳(メタデータ) (2023-05-19T08:18:24Z) - A Flexible Schema-Guided Dialogue Management Framework: From Friendly
Peer to Virtual Standardized Cancer Patient [2.1530718840070784]
本稿では,仮想標準化癌患者SOPHIEの開発に使用される汎用的スキーマ誘導対話管理フレームワークについて述べる。
我々のエージェントは、自然な、感情的に適切で、癌患者としての彼女の役割と一致した反応を生み出すと判断される。
論文 参考訳(メタデータ) (2022-07-15T03:52:00Z) - Domain-specific Language Pre-training for Dialogue Comprehension on
Clinical Inquiry-Answering Conversations [28.567701055153385]
自然言語処理の最近の進歩は、大規模な事前訓練された言語バックボーンを機械理解や情報抽出のタスクに活用できることを示唆している。
しかし、事前トレーニングと下流臨床ドメインのギャップのため、ドメイン固有のアプリケーションに一般的なバックボーンを活用することは依然として困難である。
本稿では,対話理解などの下流タスクの性能向上を目的とした,ドメイン固有言語事前学習を提案する。
論文 参考訳(メタデータ) (2022-06-06T08:45:03Z) - A Benchmark for Automatic Medical Consultation System: Frameworks, Tasks
and Datasets [70.32630628211803]
本稿では,医師と患者との対話理解とタスク指向インタラクションという,医療相談の自動化を支援する2つの枠組みを提案する。
マルチレベルな微粒なアノテーションを付加した新しい大規模医療対話データセットが導入された。
本稿では,各タスクに対するベンチマーク結果のセットを報告し,データセットのユーザビリティを示し,今後の研究のベースラインを設定する。
論文 参考訳(メタデータ) (2022-04-19T16:43:21Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。