論文の概要: SimClinician: A Multimodal Simulation Testbed for Reliable Psychologist AI Collaboration in Mental Health Diagnosis
- arxiv url: http://arxiv.org/abs/2512.08953v1
- Date: Fri, 28 Nov 2025 01:11:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 04:16:52.566698
- Title: SimClinician: A Multimodal Simulation Testbed for Reliable Psychologist AI Collaboration in Mental Health Diagnosis
- Title(参考訳): SimClinician:メンタルヘルス診断における信頼性の高い心理学的AIコラボレーションのためのマルチモーダルシミュレーション
- Authors: Filippo Cenacchi, Longbing Cao, Deborah Richards,
- Abstract要約: 我々は、患者データを心理学的AI共同診断に変換するインタラクティブなシミュレーションプラットフォームであるSimClinicianを紹介する。
E-DAICコーパス(臨床インタビュー276件、シミュレーション480,000件)で試験したところ、SimClinicianは、確認手順が承認率を23%引き上げ、エスカレーションを9%以下に抑えることを示した。
- 参考スコア(独自算出の注目度): 26.208414155165432
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI based mental health diagnosis is often judged by benchmark accuracy, yet in practice its value depends on how psychologists respond whether they accept, adjust, or reject AI suggestions. Mental health makes this especially challenging: decisions are continuous and shaped by cues in tone, pauses, word choice, and nonverbal behaviors of patients. Current research rarely examines how AI diagnosis interface design influences these choices, leaving little basis for reliable testing before live studies. We present SimClinician, an interactive simulation platform, to transform patient data into psychologist AI collaborative diagnosis. Contributions include: (1) a dashboard integrating audio, text, and gaze-expression patterns; (2) an avatar module rendering de-identified dynamics for analysis; (3) a decision layer that maps AI outputs to multimodal evidence, letting psychologists review AI reasoning, and enter a diagnosis. Tested on the E-DAIC corpus (276 clinical interviews, expanded to 480,000 simulations), SimClinician shows that a confirmation step raises acceptance by 23%, keeping escalations below 9%, and maintaining smooth interaction flow.
- Abstract(参考訳): AIベースのメンタルヘルス診断は、しばしばベンチマーク精度によって判断されるが、実際には、その価値は、心理学者がAI提案を受け入れ、調整し、拒否するかによって決まる。
意思決定は連続的で、音調、ポーズ、言葉の選択、そして患者の非言語行動によって形作られます。
現在の研究では、AI診断インターフェースの設計がこれらの選択にどのように影響するかをめったに調査しておらず、ライブ研究の前に信頼性の高いテストの基盤はほとんど残っていない。
我々は、患者データを心理学的AI協調診断に変換するインタラクティブなシミュレーションプラットフォームであるSimClinicianを提案する。
コントリビューションには、(1)音声、テキスト、および視線表現パターンを統合するダッシュボード、(2)分析のために非同定されたダイナミクスをレンダリングするアバターモジュール、(3)AI出力をマルチモーダルなエビデンスにマッピングし、心理学者はAI推論をレビューし、診断に入ります。
E-DAICコーパス(臨床インタビュー276件、シミュレーション480,000件)でテストした結果、SimClinician氏は、確認ステップが受け入れ率を23%引き上げ、エスカレーションを9%以下に抑え、スムーズな相互作用フローを維持することを示した。
関連論文リスト
- MindEval: Benchmarking Language Models on Multi-turn Mental Health Support [10.524387723320432]
MindEvalは、現実的でマルチターンのメンタルヘルスセラピー会話において、言語モデルを自動的に評価するためのフレームワークである。
シミュレーションされた患者が生成したテキストに対する現実性を定量的に検証し、自動判断と人的判断との間に強い相関関係を示す。
われわれは12の最先端のLCMを評価し、AI固有のコミュニケーションパターンに特に弱点がある平均6点中4点以下で、すべてのモデルが苦戦していることを示す。
論文 参考訳(メタデータ) (2025-11-23T15:19:29Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - TestAgent: An Adaptive and Intelligent Expert for Human Assessment [62.060118490577366]
対話型エンゲージメントによる適応テストを強化するために,大規模言語モデル(LLM)を利用したエージェントであるTestAgentを提案する。
TestAgentは、パーソナライズされた質問の選択をサポートし、テストテイカーの応答と異常をキャプチャし、動的で対話的なインタラクションを通じて正確な結果を提供する。
論文 参考訳(メタデータ) (2025-06-03T16:07:54Z) - Beyond Empathy: Integrating Diagnostic and Therapeutic Reasoning with Large Language Models for Mental Health Counseling [50.83055329849865]
PsyLLMは、メンタルヘルスカウンセリングの診断と治療的推論を統合するために設計された大きな言語モデルである。
Redditから現実世界のメンタルヘルス投稿を処理し、マルチターン対話構造を生成する。
実験の結果,PsyLLMは最先端のベースラインモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-21T16:24:49Z) - MAGI: Multi-Agent Guided Interview for Psychiatric Assessment [50.6150986786028]
我々は,ゴールドスタンダードのMini International Neuropsychiatric Interview(MINI)を自動計算ナビゲーションに変換する最初のフレームワークであるMAGIを紹介する。
臨床検査法, 会話適応性, 説明可能な推論を併用することにより, MAGI は LLM 支援型メンタルヘルスアセスメントを推し進めることを示す。
論文 参考訳(メタデータ) (2025-04-25T11:08:27Z) - 3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark [2.3011663397108078]
3MDBenchは、LVLM駆動の遠隔医療相談をシミュレートし評価するためのオープンソースのフレームワークである。
内部推論によるマルチモーダル対話は、非対話設定よりもF1スコアが6.5%向上する。
診断畳み込みニューラルネットワークからLVLMのコンテキストに予測を注入すると、F1は最大20%向上する。
論文 参考訳(メタデータ) (2025-03-26T07:32:05Z) - Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators [5.217925404425509]
本稿では,実際の医師と患者との会話から対話戦略を抽出し,患者シミュレータのトレーニングを指導する。
本シミュレータは, 動的対話戦略を用いて, 人為性が高く, 幻覚率も低いことを示す。
論文 参考訳(メタデータ) (2025-01-16T11:41:14Z) - MDD-5k: A New Diagnostic Conversation Dataset for Mental Disorders Synthesized via Neuro-Symbolic LLM Agents [25.987334407396396]
我々は、精神疾患の診断会話を合成するための神経象徴的マルチエージェントフレームワークを設計する。
中国最大の精神障害診断データセットMDD-5kを開発した。
論文 参考訳(メタデータ) (2024-08-22T05:59:47Z) - Empowering Psychotherapy with Large Language Models: Cognitive
Distortion Detection through Diagnosis of Thought Prompting [82.64015366154884]
本研究では,認知的歪み検出の課題について検討し,思考の早期発見(DoT)を提案する。
DoTは、事実と思考を分離するための主観的評価、思考と矛盾する推論プロセスを引き出すための対照的な推論、認知スキーマを要約するスキーマ分析という3つの段階を通して、患者のスピーチの診断を行う。
実験により、DoTは認知的歪み検出のためのChatGPTよりも大幅に改善され、一方で人間の専門家が承認した高品質な合理性を生成することが示された。
論文 参考訳(メタデータ) (2023-10-11T02:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。