論文の概要: DELTA: Deliberative Multi-Agent Reasoning with Reinforcement Learning for Multimodal Psychological Counseling
- arxiv url: http://arxiv.org/abs/2602.04112v1
- Date: Wed, 04 Feb 2026 00:56:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.327921
- Title: DELTA: Deliberative Multi-Agent Reasoning with Reinforcement Learning for Multimodal Psychological Counseling
- Title(参考訳): DELTA:マルチモーダル心理学的カウンセリングのための強化学習による熟考的マルチエージェント推論
- Authors: Jiangnan Yang, Junjie Chen, Fei Wang, Yiqi Nie, Yuxin Liu, Zhangling Duan, Jie Chen,
- Abstract要約: マルチモーダル信号を用いた構造化推論プロセスとしてカウンセリングをモデル化するマルチエージェントフレームワークであるDELTAを紹介する。
DELTAは、モデル間のカウンセリング品質と感情の両方を改善する。
- 参考スコア(独自算出の注目度): 13.005090874995645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Psychological counseling is a fundamentally multimodal cognitive process in which clinicians integrate verbal content with visual and vocal cues to infer clients' mental states and respond empathically. However, most existing language-model-based counseling systems operate on text alone and rely on implicit mental state inference. We introduce DELTA, a deliberative multi-agent framework that models counseling as a structured reasoning process over multimodal signals, separating evidence grounding, mental state abstraction, and response generation. DELTA further incorporates reinforcement learning guided by a distribution-level Emotion Attunement Score to encourage emotionally attuned responses. Experiments on a multimodal counseling benchmark show that DELTA improves both counseling quality and emotion attunement across models. Ablation and qualitative analyses suggest that explicit multimodal reasoning and structured mental state representations play complementary roles in supporting empathic human-AI interaction.
- Abstract(参考訳): 心理学的カウンセリング(英: Psychological counseling)は、臨床医が言語内容と視覚的・音声的手がかりを統合して、クライアントの精神状態を推測し、共感的に反応する、基本的なマルチモーダル認知プロセスである。
しかし、既存の言語モデルに基づくカウンセリングシステムはテキストだけで動作しており、暗黙の精神状態推論に依存している。
DELTAは、カウンセリングをマルチモーダル信号による構造化推論プロセスとしてモデル化し、根拠の分離、精神状態の抽象化、応答生成を行う。
DELTAはさらに、感情に敏感な反応を促すために、分布レベルの感情評価スコアによって導かれる強化学習を取り入れている。
マルチモーダルカウンセリングベンチマークの実験では、DELTAはカウンセリングの品質とモデル間の感情の緊張の両方を改善している。
アブレーションと質的分析は、明示的なマルチモーダルな推論と構造化された精神状態表現が共感的人間とAIの相互作用を支援するのに相補的な役割を担っていることを示唆している。
関連論文リスト
- A Unified Spoken Language Model with Injected Emotional-Attribution Thinking for Human-like Interaction [50.05919688888947]
本稿では,感情的インテリジェンスのための統一言語モデルを提案する。
IEATは、ユーザーの感情状態とその根本原因をモデルの内部推論プロセスに組み込んでおり、明示的な監督として扱われるのではなく、感情を意識した推論を内部化することができる。
HumDial(Human-like Spoken Dialogue Systems Challenge)Emotional Intelligenceベンチマークの実験は、提案手法が感情軌道モデリング、感情的推論、共感的応答生成にまたがるトップランクのパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2026-01-08T14:07:30Z) - COMPEER: Controllable Empathetic Reinforcement Reasoning for Emotional Support Conversation [47.0476311232988]
本稿では、自然言語推論と構造化された心理的ステップを組み合わせた、制御可能な共感推論を提案する。
我々は、正確なフィードバックを提供する統一されたプロセスアウトカム報酬モデルによる強化学習を採用する。
提案手法は,共感的,人間的支援システムの開発を推し進め,モデルの感情支援能力を大幅に向上させる。
論文 参考訳(メタデータ) (2025-08-13T06:09:32Z) - Beyond Empathy: Integrating Diagnostic and Therapeutic Reasoning with Large Language Models for Mental Health Counseling [50.83055329849865]
PsyLLMは、メンタルヘルスカウンセリングの診断と治療的推論を統合するために設計された大きな言語モデルである。
Redditから現実世界のメンタルヘルス投稿を処理し、マルチターン対話構造を生成する。
実験の結果,PsyLLMは最先端のベースラインモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-21T16:24:49Z) - DeepPsy-Agent: A Stage-Aware and Deep-Thinking Emotional Support Agent System [10.262822400879688]
DeepPsy-Agentは、心理学における3段階の援助理論とディープラーニング技術を組み合わせた革新的な心理学的支援システムである。
リアルな3万の心理的ホットラインの会話に基づいて、AIシミュレーション対話と専門家による再注釈戦略を用いて、高品質なマルチターン対話データセットを構築します。
論文 参考訳(メタデータ) (2025-03-20T05:59:29Z) - MADP: Multi-Agent Deductive Planning for Enhanced Cognitive-Behavioral Mental Health Question Answer [7.738135970011351]
マルチエージェント・デダクティブ・プランニング(MADP)というフレームワークを提案する。
MADPは認知行動療法(CBT)の様々な心理的要素間の相互作用に基づいている
我々はMADPフレームワークに基づいた新しいデータセットを構築し、それをLLM(Large Language Models)の微調整に利用する。
論文 参考訳(メタデータ) (2025-01-27T07:18:47Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological Counseling [27.193022503592342]
中国における心理カウンセリングのための多面的対話再構築・評価フレームワークCPsyCounを提案する。
心理カウンセリングレポートを完全に活用するために、高品質な対話を構築するための2段階のアプローチが考案された。
マルチターン心理相談の効果的な自動評価のための総合評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-05-26T05:18:00Z) - Empathy Through Multimodality in Conversational Interfaces [1.360649555639909]
会話型健康エージェント(CHA)は、感情的なインテリジェンスを組み込むためにテキスト分析を超越するニュアンスなサポートを提供することで、医療を再定義している。
本稿では、豊かなマルチモーダル対話のためのLCMベースのCHAについて紹介する。
マルチモーダルな手がかりを解析することにより、ユーザの感情状態に順応的に解釈し、応答し、文脈的に認識され、共感的に反響する音声応答を提供する。
論文 参考訳(メタデータ) (2024-05-08T02:48:29Z) - K-ESConv: Knowledge Injection for Emotional Support Dialogue Systems via
Prompt Learning [83.19215082550163]
K-ESConvは、感情支援対話システムのための、新しい学習に基づく知識注入手法である。
本研究では,情緒的支援データセットESConvを用いて,外部の専門的情緒的Q&Aフォーラムから知識を抽出し,組み込んだモデルを評価した。
論文 参考訳(メタデータ) (2023-12-16T08:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。