論文の概要: Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis
- arxiv url: http://arxiv.org/abs/2508.11398v1
- Date: Fri, 15 Aug 2025 11:08:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.862054
- Title: Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis
- Title(参考訳): 信頼できるAI心理療法:多エージェントLLMワークフローによる精神障害診断
- Authors: Mithat Can Ozgun, Jiahuan Pei, Koen Hindriks, Lucia Donatelli, Qingzhi Liu, Xin Sun, Junxiao Wang,
- Abstract要約: DSM5AgentFlowは、DSM-5 Level-1診断票を自律的に生成する最初のLCMベースのエージェントワークフローである。
特定のクライアントプロファイルでセラピストとクライアントの対話をシミュレートすることで、このフレームワークは透明でステップバイステップの障害予測を提供する。
このワークフローは、精神的な健康診断のための補完的なツールとして機能し、倫理的および法的基準の遵守を保証する。
- 参考スコア(独自算出の注目度): 7.836242801813015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based agents have emerged as transformative tools capable of executing complex tasks through iterative planning and action, achieving significant advancements in understanding and addressing user needs. Yet, their effectiveness remains limited in specialized domains such as mental health diagnosis, where they underperform compared to general applications. Current approaches to integrating diagnostic capabilities into LLMs rely on scarce, highly sensitive mental health datasets, which are challenging to acquire. These methods also fail to emulate clinicians' proactive inquiry skills, lack multi-turn conversational comprehension, and struggle to align outputs with expert clinical reasoning. To address these gaps, we propose DSM5AgentFlow, the first LLM-based agent workflow designed to autonomously generate DSM-5 Level-1 diagnostic questionnaires. By simulating therapist-client dialogues with specific client profiles, the framework delivers transparent, step-by-step disorder predictions, producing explainable and trustworthy results. This workflow serves as a complementary tool for mental health diagnosis, ensuring adherence to ethical and legal standards. Through comprehensive experiments, we evaluate leading LLMs across three critical dimensions: conversational realism, diagnostic accuracy, and explainability. Our datasets and implementations are fully open-sourced.
- Abstract(参考訳): LLMベースのエージェントは、反復的な計画と行動を通じて複雑なタスクを実行し、ユーザニーズを理解し、対処する上で大きな進歩を達成できるトランスフォーメーションツールとして登場した。
しかし、それらの効果は、一般的な応用に比べてパフォーマンスが劣る精神保健診断などの専門分野に限られている。
LLMに診断機能を統合するための現在のアプローチは、取得が困難である、希少で高感度なメンタルヘルスデータセットに依存している。
これらの手法はまた、臨床医の積極的な調査スキルのエミュレートに失敗し、多面的な会話理解が欠如し、アウトプットを専門的な臨床推論と整合させるのに苦労している。
これらのギャップに対処するために,DSM-5 Level-1 診断票を自律的に生成する LLM ベースのエージェントワークフロー DSM5AgentFlow を提案する。
特定のクライアントプロファイルとセラピストとクライアントの対話をシミュレートすることで、このフレームワークは透過的でステップバイステップの障害予測を提供し、説明可能な信頼性のある結果を生み出す。
このワークフローは、精神的な健康診断のための補完的なツールとして機能し、倫理的および法的基準の遵守を保証する。
包括的実験を通じて,会話リアリズム,診断精度,説明可能性という3つの重要な次元にわたるLLMの評価を行った。
データセットと実装は完全にオープンソースです。
関連論文リスト
- MAGI: Multi-Agent Guided Interview for Psychiatric Assessment [50.6150986786028]
我々は,ゴールドスタンダードのMini International Neuropsychiatric Interview(MINI)を自動計算ナビゲーションに変換する最初のフレームワークであるMAGIを紹介する。
臨床検査法, 会話適応性, 説明可能な推論を併用することにより, MAGI は LLM 支援型メンタルヘルスアセスメントを推し進めることを示す。
論文 参考訳(メタデータ) (2025-04-25T11:08:27Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Demystifying Large Language Models for Medicine: A Primer [50.83806796466396]
大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文 参考訳(メタデータ) (2024-10-24T15:41:56Z) - Depression Diagnosis Dialogue Simulation: Self-improving Psychiatrist with Tertiary Memory [35.41386783586689]
本稿では,患者と精神科医の対話を模擬してうつ病診断を促進する自己改善型会話エージェントシステムであるエージェント・メンタル・クリニック(AMC)を紹介する。
本稿では,3次記憶構造,対話制御,およびメモリサンプリングモジュールから構成される精神科医エージェントを設計し,精神科医エージェントが反映するスキルを十分に活用し,抑うつリスクと自殺リスク診断の会話による高精度化を実現する。
論文 参考訳(メタデータ) (2024-09-20T14:25:08Z) - MediQ: Question-Asking LLMs and a Benchmark for Reliable Interactive Clinical Reasoning [36.400896909161006]
我々は積極的に質問を行い、より多くの情報を集め、確実に応答するシステムを開発する。
LLMの問合せ能力を評価するためのベンチマーク - MediQ を導入する。
論文 参考訳(メタデータ) (2024-06-03T01:32:52Z) - Automating PTSD Diagnostics in Clinical Interviews: Leveraging Large Language Models for Trauma Assessments [7.219693607724636]
我々は、ワークフローにカスタマイズされた大言語モデル(LLM)を統合することで、この不足に対処することを目指している。
臨床医が担当する診断面接411件を収集し,高品質なデータを得るための新しいアプローチを考案した。
インタビュー内容に基づいたPTSD診断評価を自動化するための総合的なフレームワークを構築した。
論文 参考訳(メタデータ) (2024-05-18T05:04:18Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Beyond Direct Diagnosis: LLM-based Multi-Specialist Agent Consultation
for Automatic Diagnosis [30.943705201552643]
本研究では,潜在的な疾患に対するエージェントの確率分布を適応的に融合させることにより,現実世界の診断過程をモデル化する枠組みを提案する。
提案手法では,パラメータ更新とトレーニング時間を大幅に短縮し,効率と実用性を向上する。
論文 参考訳(メタデータ) (2024-01-29T12:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。