論文の概要: MCTSr-Zero: Self-Reflective Psychological Counseling Dialogues Generation via Principles and Adaptive Exploration
- arxiv url: http://arxiv.org/abs/2505.23229v1
- Date: Thu, 29 May 2025 08:30:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.760134
- Title: MCTSr-Zero: Self-Reflective Psychological Counseling Dialogues Generation via Principles and Adaptive Exploration
- Title(参考訳): MCTSr-Zero:原理と適応探索による自己反射型心理学的会話生成
- Authors: Hao Lu, Yanchi Gu, Haoyuan Huang, Yulin Zhou, Ningxin Zhu, Chen Li,
- Abstract要約: オープンエンドな人間中心対話のためのフレームワークであるMCTSr-Zeroを紹介する。
中心となるイノベーションは"ドメインアライメント"であり、MCTS検索の目的をシフトさせる。
マルチターン心理カウンセリング対話の評価のためのベンチマークであるPsyEvalについても紹介する。
- 参考スコア(独自算出の注目度): 6.448134875469534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The integration of Monte Carlo Tree Search (MCTS) with Large Language Models (LLMs) has demonstrated significant success in structured, problem-oriented tasks. However, applying these methods to open-ended dialogues, such as those in psychological counseling, presents unique challenges. Unlike tasks with objective correctness, success in therapeutic conversations depends on subjective factors like empathetic engagement, ethical adherence, and alignment with human preferences, for which strict "correctness" criteria are ill-defined. Existing result-oriented MCTS approaches can therefore produce misaligned responses. To address this, we introduce MCTSr-Zero, an MCTS framework designed for open-ended, human-centric dialogues. Its core innovation is "domain alignment", which shifts the MCTS search objective from predefined end-states towards conversational trajectories that conform to target domain principles (e.g., empathy in counseling). Furthermore, MCTSr-Zero incorporates "Regeneration" and "Meta-Prompt Adaptation" mechanisms to substantially broaden exploration by allowing the MCTS to consider fundamentally different initial dialogue strategies. We evaluate MCTSr-Zero in psychological counseling by generating multi-turn dialogue data, which is used to fine-tune an LLM, PsyLLM. We also introduce PsyEval, a benchmark for assessing multi-turn psychological counseling dialogues. Experiments demonstrate that PsyLLM achieves state-of-the-art performance on PsyEval and other relevant metrics, validating MCTSr-Zero's effectiveness in generating high-quality, principle-aligned conversational data for human-centric domains and addressing the LLM challenge of consistently adhering to complex psychological standards.
- Abstract(参考訳): Monte Carlo Tree Search (MCTS)とLarge Language Models (LLM)の統合は、構造化された問題指向タスクにおいて大きな成功を収めた。
しかし、心理学的カウンセリングなどのオープンエンド対話にこれらの手法を適用すると、ユニークな課題が提示される。
客観的な正当性を持つタスクとは異なり、治療的会話の成功は、厳密な「正当性」基準が不明確である、共感的エンゲージメント、倫理的遵守、人間の嗜好との整合といった主観的要因に依存する。
したがって、既存の結果指向MCTSアプローチは、一致しない応答を生成することができる。
そこで我々は,オープンエンドな人間中心対話のためのMCTSフレームワークであるMCTSr-Zeroを紹介する。
その中心となるイノベーションは"ドメインアライメント"であり、MCTSの検索対象を定義済みの終末状態から、対象とするドメイン原則(例えば、カウンセリングにおける共感)に準拠した会話の軌跡へとシフトさせる。
さらに、MCTSr-Zeroは「再生」と「Meta-Prompt Adaptation」のメカニズムを導入し、MCTSが基本的な異なる初期対話戦略を考慮できるようにすることで、探索を大幅に拡大する。
LLM, PsyLLMを微調整する多ターン対話データを生成し, 心理カウンセリングにおけるMCTSr-Zeroの評価を行った。
マルチターン心理カウンセリング対話の評価のためのベンチマークであるPsyEvalについても紹介する。
実験により、PsyLLMはPsyEvalや他の関連するメトリクスの最先端のパフォーマンスを達成し、MCTSr-Zeroが人間中心のドメインに対して高品質で原則に準拠した会話データを生成することの有効性を検証し、複雑な心理学的基準に一貫して準拠するLLMの課題に対処することを示した。
関連論文リスト
- Beyond Empathy: Integrating Diagnostic and Therapeutic Reasoning with Large Language Models for Mental Health Counseling [17.809187205107232]
PsyLLMは、メンタルヘルスカウンセリングの診断と治療的推論を統合するために設計された大きな言語モデルである。
このパイプラインは現実世界のメンタルヘルスポストを処理し、マルチターン対話構造を生成する。
厳密な多次元フィルタリングは、高品質で臨床的に整合した対話データを生成する。
論文 参考訳(メタデータ) (2025-05-21T16:24:49Z) - Ψ-Arena: Interactive Assessment and Optimization of LLM-based Psychological Counselors with Tripartite Feedback [51.26493826461026]
大規模言語モデル(LLM)の総合的評価と最適化のための対話型フレームワークであるPsi-Arenaを提案する。
アリーナは、心理学的にプロファイルされたNPCクライアントとの多段階対話を通じて現実世界のカウンセリングをシミュレートする現実的なアリーナ相互作用を特徴としている。
8つの最先端のLLM実験は、異なる実世界のシナリオと評価の観点で大きなパフォーマンス変化を示す。
論文 参考訳(メタデータ) (2025-05-06T08:22:51Z) - Crisp: Cognitive Restructuring of Negative Thoughts through Multi-turn Supportive Dialogues [75.16593367473259]
認知的再構成(Cognitive Restructuring, CR)は、個人の否定的思考を識別し、再構成することを目的とした精神療法のプロセスである。
既存の取り組みでは、単純なテキストの書き直し、固定パターンの対話、あるいはワンショットのCRワークフローを通じてCRを実装している。
本稿では,CRの新しいフレームワークであるCRDialを提案する。
論文 参考訳(メタデータ) (2025-04-24T04:22:00Z) - HealMe: Harnessing Cognitive Reframing in Large Language Models for Psychotherapy [25.908522131646258]
メンタルエンハンスメント(HealMe)モデルにおける適応言語によるヘルピングとエンパワーメントについて紹介する。
この新しい認知的リフレーミング療法は、根深い否定的思考に効果的に対処し、合理的でバランスの取れた視点を育む。
我々は、認知リフレーミングのパフォーマンスを厳格に評価するために特別に設計された、包括的で専門的な心理学的評価指標を採用した。
論文 参考訳(メタデータ) (2024-02-26T09:10:34Z) - Response Generation for Cognitive Behavioral Therapy with Large Language
Models: Comparative Study with Socratic Questioning [6.400704401007114]
本研究では,感情変化,認知的変化,対話品質などの主観的評価に及ぼす生成応答の影響について検討した。
GPT-4を使用すると、気分の変化、共感、その他の対話の質が著しく向上する。
論文 参考訳(メタデータ) (2024-01-29T08:53:41Z) - MR-GSM8K: A Meta-Reasoning Benchmark for Large Language Model Evaluation [60.65820977963331]
大規模言語モデル(LLM)のための新しい評価パラダイムを導入する。
このパラダイムは、しばしば推論プロセスを無視する結果指向の評価から、より包括的な評価へと重点を移す。
GSM8Kデータセットにこのパラダイムを適用し,MR-GSM8Kベンチマークを開発した。
論文 参考訳(メタデータ) (2023-12-28T15:49:43Z) - Building Emotional Support Chatbots in the Era of LLMs [64.06811786616471]
我々は,Large Language Models (LLMs) の計算能力で人間の洞察を合成する革新的な方法論を導入する。
また,ChatGPTの文脈内学習の可能性を利用して,ExTESと呼ばれる感情支援対話データセットを生成する。
次に、LLaMAモデルに高度なチューニング手法を展開し、多様なトレーニング戦略の影響を検証し、最終的に感情的支援の相互作用に細心の注意を払ってLLMを出力する。
論文 参考訳(メタデータ) (2023-08-17T10:49:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。