論文の概要: EmoHarbor: Evaluating Personalized Emotional Support by Simulating the User's Internal World
- arxiv url: http://arxiv.org/abs/2601.01530v1
- Date: Sun, 04 Jan 2026 13:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.467762
- Title: EmoHarbor: Evaluating Personalized Emotional Support by Simulating the User's Internal World
- Title(参考訳): EmoHarbor: ユーザの内部世界をシミュレートしたパーソナライズされた感情支援の評価
- Authors: Jing Ye, Lu Xiang, Yaping Zhang, Chengqing Zong,
- Abstract要約: EmoHarborは、ユーザの内界をシミュレートする自動評価フレームワークである。
Chain-of-Agentアーキテクチャを使用して、ユーザの内部プロセスを3つの特別な役割に分解する。
EmoHarborは再現性が高くスケーラブルなフレームワークを提供し、よりニュアンスでユーザ対応の感情支援システムの開発と評価をガイドする。
- 参考スコア(独自算出の注目度): 43.2336028953103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current evaluation paradigms for emotional support conversations tend to reward generic empathetic responses, yet they fail to assess whether the support is genuinely personalized to users' unique psychological profiles and contextual needs. We introduce EmoHarbor, an automated evaluation framework that adopts a User-as-a-Judge paradigm by simulating the user's inner world. EmoHarbor employs a Chain-of-Agent architecture that decomposes users' internal processes into three specialized roles, enabling agents to interact with supporters and complete assessments in a manner similar to human users. We instantiate this benchmark using 100 real-world user profiles that cover a diverse range of personality traits and situations, and define 10 evaluation dimensions of personalized support quality. Comprehensive evaluation of 20 advanced LLMs on EmoHarbor reveals a critical insight: while these models excel at generating empathetic responses, they consistently fail to tailor support to individual user contexts. This finding reframes the central challenge, shifting research focus from merely enhancing generic empathy to developing truly user-aware emotional support. EmoHarbor provides a reproducible and scalable framework to guide the development and evaluation of more nuanced and user-aware emotional support systems.
- Abstract(参考訳): 感情的支援会話の現在の評価パラダイムは、一般的な共感的反応に報いる傾向にあるが、サポートがユーザーのユニークな心理的プロファイルとコンテキスト的ニーズに真にパーソナライズされているかどうかを評価できない。
EmoHarborは、ユーザの内部世界をシミュレートすることで、ユーザ・アズ・ア・ジャッジのパラダイムを採用する自動評価フレームワークである。
EmoHarborは、ユーザの内部プロセスを3つの特別な役割に分解するChain-of-Agentアーキテクチャを採用している。
我々はこのベンチマークを、さまざまな性格特性や状況をカバーする現実世界の100のユーザープロファイルを用いてインスタンス化し、パーソナライズされたサポート品質の評価次元を10つ定義する。
EmoHarbor上での20の高度なLCMの包括的評価は、重要な洞察を浮き彫りにしている。
この発見は、研究の焦点を単なる一般的な共感の強化から、真にユーザ対応の感情サポートの開発へと変えて、中心的な課題を再構築する。
EmoHarborは再現性が高くスケーラブルなフレームワークを提供し、よりニュアンスでユーザ対応の感情支援システムの開発と評価をガイドする。
関連論文リスト
- Detecting Emotional Dynamic Trajectories: An Evaluation Framework for Emotional Support in Language Models [6.810484095299127]
感情支援は人間とAIの相互作用における中核的な能力であり、心理学的カウンセリング、ロールプレイ、コンパニオンシップなどの応用がある。
大規模言語モデル(LLM)の既存の評価は、しばしば短く静的な対話に依存し、感情的サポートの動的で長期的な性質を捉えない。
本フレームワークは,328の情緒的文脈と1,152の外乱イベントからなる大規模ベンチマークを構築し,進化する対話シナリオ下での現実的な情緒的変化をシミュレートする。
論文 参考訳(メタデータ) (2025-11-12T05:47:28Z) - IntentionESC: An Intention-Centered Framework for Enhancing Emotional Support in Dialogue Systems [74.0855067343594]
感情的支援の会話では、意図の不明確さは、支持者に不適切な戦略を採用させる可能性がある。
Intention-centered Emotional Support Conversation frameworkを提案する。
支援者の意図を定義し、これらの意図を推測するための重要な感情状態の側面を特定し、それらを適切な支援戦略にマッピングする。
論文 参考訳(メタデータ) (2025-06-06T10:14:49Z) - From Generic Empathy to Personalized Emotional Support: A Self-Evolution Framework for User Preference Alignment [27.301608019492043]
大規模言語モデル(LLM)は、ユーザ固有のニーズに対応できない汎用的かつワンサイズ対応の応答を提供する。
ユーザの暗黙の好みに合うようにLCMの応答を改善するための自己進化フレームワークを提案する。
本手法は,感情支援におけるモデルの性能を著しく向上させ,不愉快な応答を低減し,ユーザの嗜好とモデル出力の相違を最小化する。
論文 参考訳(メタデータ) (2025-05-22T12:45:12Z) - Towards Empathetic Conversational Recommender Systems [77.53167131692]
本稿では,共感型会話レコメンデータ(ECR)フレームワークを提案する。
ECRには、感情対応アイテムレコメンデーションと感情対応応答生成という、2つの主要なモジュールが含まれている。
ReDialデータセットの実験は、推奨精度を高め、ユーザの満足度を向上させる上で、我々のフレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2024-08-30T15:43:07Z) - Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - MISC: A MIxed Strategy-Aware Model Integrating COMET for Emotional
Support Conversation [64.37111498077866]
本稿では,感情支援会話のための新しいモデルを提案する。
ユーザの微妙な感情状態を推測し、その後、戦略の混合を使って巧みに応答する。
評価実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-25T10:32:04Z) - CEM: Commonsense-aware Empathetic Response Generation [31.956147246779423]
本稿では,ユーザ状況に関する情報を引き出すために,コモンセンスを利用した共感応答生成手法を提案する。
我々は,共感的応答生成のためのベンチマークデータセットである共感的ダイアログに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-09-13T06:55:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。