論文の概要: MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psychiatric Consultation
- arxiv url: http://arxiv.org/abs/2603.03677v1
- Date: Wed, 04 Mar 2026 03:05:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.166064
- Title: MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psychiatric Consultation
- Title(参考訳): MIND:精神科領域における臨床支援を基礎とした一貫した検査・診断RL
- Authors: Guoyi Li, Shihao Xu, Jiatong Ma, Yunyun Han, Jianhua Chen, Yafeng Deng,
- Abstract要約: 精神科相談のための統合的調査・診断強化学習フレームワーク MIND を提案する。
具体的には,会話コンテキストを臨床検索状態に要約するクリテリア・グラウンド精神医学推論銀行(PRB)を構築した。
この基礎の上に構築されたMINDは、中間決定ステップに対するきめ細かい監督を提供するために、ルーリックベースのプロセス報酬による明確な臨床推論を強制する。
- 参考スコア(独自算出の注目度): 5.601620793903095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have advanced medical dialogue systems, yet psychiatric consultation poses substantially higher demands due to subjective ambiguity and comorbidity complexity: an agent must continuously extract psychopathological cues from incomplete and inconsistent patient reports in multi-turn interactions and perform rigorous differential diagnostic reasoning. However, existing methods face two fundamental challenges. First, without criteria-grounded clinical supports, they are prone to unsupported clinical assertions when symptoms are atypical or underspecified. Second, in multi-turn interactions, they struggle to mitigate inquiry drift (off-topic or low-yield questioning) and optimize questioning strategies. To address these challenges, we propose MIND, a unified inquiry--diagnosis reinforcement learning framework for psychiatric consultation. Specifically, we build a Criteria-Grounded Psychiatric Reasoning Bank (PRB) that summarizes dialogue context into clinical retrieval states, retrieves semantically similar reference consultations, and distills reusable criteria-grounded clinical supports to guide criteria-aligned inquiry and reasoning. Building on this foundation, MIND enforces explicit clinical reasoning with rubric-based process rewards to provide fine-grained supervision over intermediate decision steps, and incorporates a value-aware trajectory rectification mechanism to jointly improve information acquisition and diagnostic decision-making across turns. Extensive experiments demonstrate that MIND consistently outperforms strong baselines in diagnostic accuracy, empathetic interaction quality, interpretability, and generalization.
- Abstract(参考訳): 大規模言語モデル(LLM)は、先進的な医療対話システムを持つが、精神医学的な相談は、主観的あいまいさと相容れない複雑さにより、かなり高い要求を生じさせる:エージェントは、マルチターン相互作用における不完全で一貫性のない患者の報告から精神病理学的手がかりを継続的に抽出し、厳密な微分診断推論を行う必要がある。
しかし、既存の手法は2つの根本的な課題に直面している。
第一に、基準付き臨床サポートがなければ、症状が非典型的または未特定の場合に、サポートされない臨床アサーションになる傾向がある。
第二に、マルチターンインタラクションでは、調査のドリフト(トピックや低利回りの質問)を緩和し、質問戦略を最適化するのに苦労する。
これらの課題に対処するため,精神科相談のための統合的調査・診断強化学習フレームワークであるMINDを提案する。
具体的には、対話状況を臨床検索状態に要約し、意味的に類似した参照相談を検索し、再利用可能な基準付き臨床支援を蒸留し、基準に整合した調査と推論を導出するクリテリア・グラウンド・サイコリゾニング銀行(PRB)を構築した。
この基盤の上に、MINDはルーブリックに基づくプロセス報酬による明確な臨床推論を強制し、中間決定ステップをきめ細かな監督を提供し、ターン間の情報取得と診断決定を共同的に改善する価値認識軌道修正機構を組み込んだ。
広範囲な実験により、MINDは診断精度、共感的相互作用の品質、解釈可能性、一般化において、一貫して強いベースラインを上回ります。
関連論文リスト
- MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus [24.19892707167392]
臨床診断のための既存のAIアプローチは、透明性、構造化推論、デプロイ性に欠けることが多い。
標準化された異常所見から診断仮説を生成するエンド・ツー・エンドのフレームワークであるMedCoRAGを提案する。
その後、UMLS知識グラフパスと臨床ガイドラインを共同で検索し、解析することで、患者固有のエビデンスパッケージを構築する。
論文 参考訳(メタデータ) (2026-03-05T12:58:45Z) - LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis [14.82377002030236]
精神疾患は世界中で広く普及している。
精神科医の不足と面接に基づく診断の固有の主観性は、タイムリーで一貫した精神的健康評価に重大な障壁をもたらす。
大規模マルチエージェントベンチマークであるLingxiDiagBenchを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:46:05Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - MedConsultBench: A Full-Cycle, Fine-Grained, Process-Aware Benchmark for Medical Consultation Agents [10.109613967215447]
MedConsultBenchは,オンラインコンサルテーションサイクルの完全な評価を目的とした総合的なフレームワークである。
本手法では,臨床情報取得をサブターンレベルで追跡するために,AIU(Atomic Information Units)を導入している。
オンラインコンサルティングに固有の不明瞭さと曖昧さに対処することで、このベンチマークは不確実性を認識しながら簡潔な調査を評価する。
論文 参考訳(メタデータ) (2026-01-19T02:18:10Z) - From Medical Records to Diagnostic Dialogues: A Clinical-Grounded Approach and Dataset for Psychiatric Comorbidity [24.19771858153057]
複数の共起性障害の複雑さのため、精神疾患は臨床的に有意であるが困難である。
人工患者電子カルテ構築とマルチエージェント診断ダイアログ生成を組み合わせた新しいアプローチを開発した。
PsyCoTalkは、精神科医が検証した3000の多ターン診断対話を含む、コオービディティをサポートする最初の大規模対話データセットである。
論文 参考訳(メタデータ) (2025-10-29T07:18:43Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - Beyond Empathy: Integrating Diagnostic and Therapeutic Reasoning with Large Language Models for Mental Health Counseling [50.83055329849865]
PsyLLMは、メンタルヘルスカウンセリングの診断と治療的推論を統合するために設計された大きな言語モデルである。
Redditから現実世界のメンタルヘルス投稿を処理し、マルチターン対話構造を生成する。
実験の結果,PsyLLMは最先端のベースラインモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-21T16:24:49Z) - MedCoT: Medical Chain of Thought via Hierarchical Expert [48.91966620985221]
本稿では,新しい階層的検証手法であるMedCoTについて述べる。
生体画像検査における解釈可能性と精度を高めるように設計されている。
4つの標準Med-VQAデータセットに対する実験的評価は、MedCoTが既存の最先端アプローチを上回ることを示している。
論文 参考訳(メタデータ) (2024-12-18T11:14:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。