論文の概要: ENPMR-Bench: Benchmarking Proactive Memory Retrieval for Emotional Support Agents
- arxiv url: http://arxiv.org/abs/2605.27240v1
- Date: Tue, 26 May 2026 16:22:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.410051
- Title: ENPMR-Bench: Benchmarking Proactive Memory Retrieval for Emotional Support Agents
- Title(参考訳): ENPMR-Bench:感情支援エージェントのためのアクティブメモリ検索のベンチマーク
- Authors: Xing Fu, Yulin Hu, Mengtong Ji, Haozhen Li, Yixin Sun, Weixiang Zhao, Yanyan Zhao, Bing Qin,
- Abstract要約: ENPMR-Benchは,情緒的欲求認識型アクティブメモリ検索のためのベンチマークである。
ENPMR-Benchは1,800以上のメモリ拡張ダイアログを含み、感情的なニーズと支援的なメモリタイプの間の構造化マッピングを定義する。
- 参考スコア(独自算出の注目度): 53.83618283684421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Memory-augmented language agents are increasingly deployed in affective applications such as emotional support, where understanding and responding to users' latent emotional needs is critical. However, existing research often treats memory as a tool for factual retrieval, overlooking its role in shaping users' emotional experiences. In this work, we introduce ENPMR-Bench, a benchmark for evaluating Emotional Need-aware Proactive Memory Retrieval (ENPMR), a core capability that enables agents to infer users' latent emotional needs and proactively retrieve appropriate memories to support empathetic interaction. Grounded in Maslow's hierarchy of needs, ENPMR-Bench includes over 1,800 memory-augmented dialogues and defines structured mappings between emotional needs and supportive memory types. Experimental results demonstrate that current retrieval paradigms, including both embedding-based and LLM-driven approaches, exhibit substantial deficiencies, with empathy scores significantly lagging behind golden memory conditions. While chain-of-thought prompting improves the alignment between inferred emotional needs and retrieved memories to some extent, a notable performance gap remains. Together, these findings reveal critical limitations in current agents and outline directions for advancing personalized emotional support through need-sensitive memory retrieval.
- Abstract(参考訳): メモリ拡張された言語エージェントは、感情的なサポートのような感情的なアプリケーションにますますデプロイされる。
しかし,既存の研究は,記憶を事実検索のツールとして扱うことが多く,ユーザの感情的体験を形作る役割を見落としている。
本研究では,情緒的情緒的相互作用をサポートするために,エージェントがユーザの潜在感情的欲求を推測し,適切な記憶を積極的に回収するコア機能である情緒的欲求認識型能動的記憶検索(ENPMR)を評価するためのベンチマークであるENPMR-Benchを紹介する。
Maslowの要求階層に基づいて、ENPMR-Benchは1,800以上のメモリ拡張ダイアログを含み、感情的ニーズと支援的メモリタイプの間の構造化マッピングを定義する。
実験結果から, 組込み型およびLCM駆動型アプローチを含む現在の検索パラダイムでは, 共感スコアが黄金の記憶条件に大きく遅れるなど, かなりの欠陥がみられた。
チェーン・オブ・シークレットは、推測された感情的欲求とある程度の記憶との整合性を改善するが、顕著なパフォーマンスギャップは残る。
これらの知見とともに、現在のエージェントの限界を明らかにし、必要に敏感なメモリ検索を通じてパーソナライズされた感情支援を促進するための方向性を示す。
関連論文リスト
- A-MBER: Affective Memory Benchmark for Emotion Recognition [3.9870633524104107]
感情認識のためのA-MBER(Affective Memory Benchmark)を提案する。
A-MBERは、記憶されたマルチセッションインタラクション履歴に根ざした現在の感情解釈に焦点を当てている。
結果は、A-MBERが特に強調するように設計されたサブセットで識別可能であることを示している。
論文 参考訳(メタデータ) (2026-04-08T12:36:18Z) - MemEmo: Evaluating Emotion in Memory Systems of Agents [30.12443912702673]
本稿では、感情情報を扱う際の記憶システムの性能を評価するための感情強調型メモリ評価ベンチマークを提案する。
textbfHuman-textbfLike textbfMemory textbfEmotion(textbfHLME)データセットを開発した。
実験結果から,3つのタスクにまたがるロバストな性能は,いずれのシステムも達成できていないことが示唆された。
論文 参考訳(メタデータ) (2026-02-27T11:46:08Z) - Memory-guided Prototypical Co-occurrence Learning for Mixed Emotion Recognition [56.00118641432005]
本稿では,感情共起パターンを明示的にモデル化するメモリ誘導型プロトタイプ共起学習フレームワークを提案する。
人間の認知記憶システムに触発されて,意味レベルの共起関係を抽出するメモリ検索戦略を導入する。
本モデルは感情分布予測のための感情情報表現を学習する。
論文 参考訳(メタデータ) (2026-02-24T04:11:25Z) - Rethinking Memory Mechanisms of Foundation Agents in the Second Half: A Survey [211.01908189012184]
今年、何百もの論文が公開されたメモリは、ユーティリティギャップを埋めるための重要なソリューションとして現れます。
ファンデーションエージェントのメモリを3次元に統一したビューを提供する。
次に、異なるエージェントトポロジの下でメモリがどのようにインスタンス化され、操作されるかを分析する。
論文 参考訳(メタデータ) (2026-01-14T07:38:38Z) - Evaluating Long-Term Memory for Long-Context Question Answering [100.1267054069757]
質問応答タスクにアノテートした合成長文対話のベンチマークであるLoCoMoを用いて,メモリ拡張手法の体系的評価を行う。
以上の結果から,メモリ拡張アプローチによりトークン使用率が90%以上削減され,競争精度が向上した。
論文 参考訳(メタデータ) (2025-10-27T18:03:50Z) - In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents [70.12342024019044]
大規模言語モデル(LLM)は、オープンエンド対話において大きな進歩を遂げているが、関連する情報の保持と取得ができないため、その有効性は制限されている。
本稿では,長期対話エージェントのための新しいメカニズムであるリフレクティブメモリ管理(RMM)を提案する。
RMMは、LongMemEvalデータセットのメモリ管理なしでベースラインよりも10%以上精度が向上している。
論文 参考訳(メタデータ) (2025-03-11T04:15:52Z) - Emotional RAG: Enhancing Role-Playing Agents through Emotional Retrieval [30.579043495085777]
本稿では,ロールプレイングエージェントの感情状態を考慮した感情認識型記憶検索フレームワーク「感情RAG」を提案する。
本フレームワークは,ロールプレイングエージェントの個性を維持する上での感情的要因を考慮せずに,その手法より優れる。
論文 参考訳(メタデータ) (2024-10-30T14:08:50Z) - MADial-Bench: Towards Real-world Evaluation of Memory-Augmented Dialogue Generation [15.64077949677469]
メモリ拡張対話システム(MADS)の有効性を評価するための新しいメモリ拡張対話ベンチマーク(MADail-Bench)を提案する。
このベンチマークは2つのタスクを別々に評価する: メモリ検索とメモリ認識は、パッシブとプロアクティブの両方のメモリリコールデータを組み込んだものである。
このベンチマークにおける最先端の埋め込みモデルと大規模言語モデルの結果は、さらなる進歩の可能性を示している。
論文 参考訳(メタデータ) (2024-09-23T17:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。