論文の概要: COMPEER: Controllable Empathetic Reinforcement Reasoning for Emotional Support Conversation
- arxiv url: http://arxiv.org/abs/2508.09521v1
- Date: Wed, 13 Aug 2025 06:09:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.775183
- Title: COMPEER: Controllable Empathetic Reinforcement Reasoning for Emotional Support Conversation
- Title(参考訳): CompEER:感情支援会話のための制御可能な共感強化推論
- Authors: Yunxiao Wang, Meng Liu, Wenqi Liu, Kaiyu Jiang, Bin Wen, Fan Yang, Tingting Gao, Guorui Zhou, Liqiang Nie,
- Abstract要約: 本稿では、自然言語推論と構造化された心理的ステップを組み合わせた、制御可能な共感推論を提案する。
我々は、正確なフィードバックを提供する統一されたプロセスアウトカム報酬モデルによる強化学習を採用する。
提案手法は,共感的,人間的支援システムの開発を推し進め,モデルの感情支援能力を大幅に向上させる。
- 参考スコア(独自算出の注目度): 47.0476311232988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotional support conversations are crucial for promoting emotional well-being, yet current models often lack deep empathetic reasoning grounded in psychological principles. To address this, we propose controllable empathetic reasoning, which combines natural language reasoning with structured psychological steps. We construct a fine-grained dataset annotated with reasoning correctness and response preferences to enable this capability. To further enhance training, we employ reinforcement learning with a unified process-outcome reward model that delivers precise feedback. To mitigate response repetitiveness from entropy collapse, we introduce personality-based dialogue rewriting and a redundancy-aware reward reweighting strategy. Our approach significantly improves model's emotional support ability, advancing the development of empathetic, human-like support systems.
- Abstract(参考訳): 感情的サポートの会話は感情的幸福を促進するのに不可欠であるが、現在のモデルは心理学的原理に根ざした深い共感的推論を欠いていることが多い。
そこで本稿では,自然言語推論と構造化された心理的ステップを組み合わせた,制御可能な共感推論を提案する。
我々は、この機能を実現するために、推論の正しさと応答の優先順位を付加したきめ細かいデータセットを構築した。
トレーニングをさらに強化するために、正確なフィードバックを提供する統一されたプロセスアウトカム報酬モデルを用いた強化学習を採用する。
エントロピー崩壊からの応答反復性を軽減するために,個性に基づく対話書き換えと冗長性を考慮した報酬重み付け戦略を導入する。
提案手法は,共感的,人間的支援システムの開発を推し進め,モデルの感情支援能力を大幅に向上させる。
関連論文リスト
- IntentionESC: An Intention-Centered Framework for Enhancing Emotional Support in Dialogue Systems [74.0855067343594]
感情的支援の会話では、意図の不明確さは、支持者に不適切な戦略を採用させる可能性がある。
Intention-centered Emotional Support Conversation frameworkを提案する。
支援者の意図を定義し、これらの意図を推測するための重要な感情状態の側面を特定し、それらを適切な支援戦略にマッピングする。
論文 参考訳(メタデータ) (2025-06-06T10:14:49Z) - Narrative-Centered Emotional Reflection: Scaffolding Autonomous Emotional Literacy with AI [0.0]
リフレクション(Reflexion)は、大規模に構造化された感情的自己反射を可能にするAIベースのプラットフォームである。
システム足場は、表面レベルの感情認識から価値に整合した行動計画への進歩的な旅である。
論文 参考訳(メタデータ) (2025-04-29T01:24:46Z) - Cause-Aware Empathetic Response Generation via Chain-of-Thought Fine-Tuning [12.766893968788263]
共感反応生成は、対話の文脈を理解し、表現された感情に反応する能力を持つエージェントを与える。
先行研究は、主に話者の感情的ラベルを活用することに重点を置いているが、感情の重要性が原因の推論を無視している。
そこで我々は,感情と原因をうまく設計したChain-of-Thoughtプロンプトを通じて統合した原因認識型共感生成手法を提案する。
論文 参考訳(メタデータ) (2024-08-21T13:11:03Z) - APTNESS: Incorporating Appraisal Theory and Emotion Support Strategies for Empathetic Response Generation [71.26755736617478]
共感反応生成は、他人の感情を理解するように設計されている。
検索強化と感情支援戦略統合を組み合わせたフレームワークを開発する。
我々の枠組みは認知的・情緒的共感の両面からLLMの共感能力を高めることができる。
論文 参考訳(メタデータ) (2024-07-23T02:23:37Z) - CauESC: A Causal Aware Model for Emotional Support Conversation [79.4451588204647]
既存のアプローチは、苦痛の感情の原因を無視します。
彼らは、話者間の相互作用における感情的ダイナミクスよりも、探究者自身の精神状態に焦点を当てている。
本稿では、まず、苦痛の感情要因と、その原因によって引き起こされる感情効果を認識する新しいフレームワークCauESCを提案する。
論文 参考訳(メタデータ) (2024-01-31T11:30:24Z) - K-ESConv: Knowledge Injection for Emotional Support Dialogue Systems via
Prompt Learning [83.19215082550163]
K-ESConvは、感情支援対話システムのための、新しい学習に基づく知識注入手法である。
本研究では,情緒的支援データセットESConvを用いて,外部の専門的情緒的Q&Aフォーラムから知識を抽出し,組み込んだモデルを評価した。
論文 参考訳(メタデータ) (2023-12-16T08:10:10Z) - Facilitating Multi-turn Emotional Support Conversation with Positive
Emotion Elicitation: A Reinforcement Learning Approach [58.88422314998018]
感情支援会話(ESC)は、精神状態を改善するための感情支援(ES)を提供することを目的としている。
既存の作業は、ESへの影響を無視し、感情的なポジティブな移行を導くための明確な目標が欠如している、接地された応答と対応戦略に留まっている。
マルチターンESCを肯定的感情誘発のプロセスとして定式化する新しいパラダイムを導入する。
論文 参考訳(メタデータ) (2023-07-16T09:58:44Z) - Affective Decoding for Empathetic Response Generation [8.391383696266704]
共感応答生成のためのAffective Decodingと呼ばれる手法を提案する。
本手法は,各デコーディングステップ中に感情信号を効果的に組み込むことができる。
我々のモデルは人間の評価により共感的であると認識されている。
論文 参考訳(メタデータ) (2021-08-18T11:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。