論文の概要: STRIDE-ED: A Strategy-Grounded Stepwise Reasoning Framework for Empathetic Dialogue Systems
- arxiv url: http://arxiv.org/abs/2604.07100v1
- Date: Wed, 08 Apr 2026 13:53:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.566713
- Title: STRIDE-ED: A Strategy-Grounded Stepwise Reasoning Framework for Empathetic Dialogue Systems
- Title(参考訳): STRIDE-ED:共感対話システムのためのストラテジグラウンドステップワイド推論フレームワーク
- Authors: Hongru Ji, Yuyin Fan, Meng Zhao, Xianghua Li, Lianwei Wu, Chao Gao,
- Abstract要約: 共感的対話は、ユーザの感情状態を認識するだけでなく、戦略を意識し、文脈に敏感な決定を行う必要がある。
本稿では,ストラテジグラウンド,解釈,Deep推論のフレームワークであるSTRIDE-EDを提案する。
- 参考スコア(独自算出の注目度): 31.01853676319371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Empathetic dialogue requires not only recognizing a user's emotional state but also making strategy-aware, context-sensitive decisions throughout response generation. However, the lack of a comprehensive empathy strategy framework, explicit task-aligned multi-stage reasoning, and high-quality strategy-aware data fundamentally limits existing approaches, preventing them from effectively modeling empathetic dialogue as a complex, multi-stage cognitive and decision-making process. To address these challenges, we propose STRIDE-ED, a STRategy-grounded, Interpretable, and DEep reasoning framework that models Empathetic Dialogue through structured, strategy-conditioned reasoning. To support effective learning, we develop a strategy-aware data refinement pipeline integrating LLM-based annotation, multi-model consistency-weighted evaluation, and dynamic sampling to construct high-quality training data aligned with empathetic strategies. Furthermore, we adopt a two-stage training paradigm that combines supervised fine-tuning with multi-objective reinforcement learning to better align model behaviors with target emotions, empathetic strategies, and response formats. Extensive experiments demonstrate that STRIDE-ED generalizes across diverse open-source LLMs and consistently outperforms existing methods on both automatic metrics and human evaluations.
- Abstract(参考訳): 共感的対話は、ユーザの感情状態を認識するだけでなく、応答生成を通じて戦略に気付き、文脈に敏感な決定を行う必要がある。
しかし、包括的な共感戦略フレームワーク、明示的なタスク整合型多段階推論、および高品質な戦略認識データは、既存のアプローチを根本的に制限し、複雑な多段階認知および意思決定プロセスとしての共感的対話を効果的にモデル化することを防ぐ。
これらの課題に対処するために、構造化された戦略条件付き推論を通して共感対話をモデル化するストラテジグラウンド、解釈可能、およびディープ推論フレームワークSTRIDE-EDを提案する。
効果的な学習を支援するため,LLMアノテーションとマルチモデル整合性評価と動的サンプリングを統合して,共感的戦略と整合した高品質なトレーニングデータを構築する戦略対応データ改善パイプラインを開発した。
さらに、教師付き微調整と多目的強化学習を組み合わせた2段階の訓練パラダイムを採用し、モデル行動と目標感情、共感戦略、応答形式をより良く整合させる。
広範囲にわたる実験により、STRIDE-EDは様々なオープンソース LLM にまたがって一般化し、自動測定と人的評価の両方において既存の手法より一貫して優れていることが示されている。
関連論文リスト
- More at Stake: How Payoff and Language Shape LLM Agent Strategies in Cooperation Dilemmas [1.6487772637295166]
LLMは、インタラクティブでマルチエージェントな設定において、自律的なエージェントとしての役割をますます高めている。
繰り返しの社会的ジレンマにおいて,ペイオフ等級と言語文脈がLCM戦略をどう形成するかを検討する。
モデルと言語全体で、インセンティブに敏感な条件付き戦略や言語間の相違など、一貫した行動パターンを観察する。
論文 参考訳(メタデータ) (2026-01-27T01:36:50Z) - Adversarial Testing in LLMs: Insights into Decision-Making Vulnerabilities [5.0778942095543576]
本稿では,大規模言語モデルの意思決定過程を体系的にストレステストする逆評価フレームワークを提案する。
我々は、GPT-3.5、GPT-4、Gemini-1.5、DeepSeek-V3など、最先端のLLMに適用する。
我々の研究は、モデル間で異なる行動パターンを強調し、信頼できるAIデプロイメントにおける適応性と公平性認識の重要性を強調した。
論文 参考訳(メタデータ) (2025-05-19T14:50:44Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - Planning Like Human: A Dual-process Framework for Dialogue Planning [31.995557540062553]
大規模言語モデル(LLM)における対話計画を強化するための2段階対話計画フレームワークを提案する。
心理学における二重過程理論に触発されて、直感的(高速)と分析的(スロー)の2つの思考様式を具現化した枠組みを提案する。
実験により,DPDPが高品質な対話と操作効率を両立し,既存手法よりも優れていることを確認した。
論文 参考訳(メタデータ) (2024-06-08T06:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。