論文の概要: A-MBER: Affective Memory Benchmark for Emotion Recognition
- arxiv url: http://arxiv.org/abs/2604.07017v1
- Date: Wed, 08 Apr 2026 12:36:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.522882
- Title: A-MBER: Affective Memory Benchmark for Emotion Recognition
- Title(参考訳): A-MBER:感情認識のための感情記憶ベンチマーク
- Authors: Deliang Wen, Ke Sun, Yu Wang,
- Abstract要約: 感情認識のためのA-MBER(Affective Memory Benchmark)を提案する。
A-MBERは、記憶されたマルチセッションインタラクション履歴に根ざした現在の感情解釈に焦点を当てている。
結果は、A-MBERが特に強調するように設計されたサブセットで識別可能であることを示している。
- 参考スコア(独自算出の注目度): 3.9870633524104107
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI assistants that interact with users over time need to interpret the user's current emotional state in order to respond appropriately and personally. However, this capability remains insufficiently evaluated. Existing emotion datasets mainly assess local or instantaneous affect, while long-term memory benchmarks focus largely on factual recall, temporal consistency, or knowledge updating. As a result, current resources provide limited support for testing whether a model can use remembered interaction history to interpret a user's present affective state. We introduce A-MBER, an Affective Memory Benchmark for Emotion Recognition, to evaluate this capability. A-MBER focuses on present affective interpretation grounded in remembered multi-session interaction history. Given an interaction trajectory and a designated anchor turn, a model must infer the user's current affective state, identify historically relevant evidence, and justify its interpretation in a grounded way. The benchmark is constructed through a staged pipeline with explicit intermediate representations, including long-horizon planning, conversation generation, annotation, question construction, and final packaging. It supports judgment, retrieval, and explanation tasks, together with robustness settings such as modality degradation and insufficient-evidence conditions. Experiments compare local-context, long-context, retrieved-memory, structured-memory, and gold-evidence conditions within a unified framework. Results show that A-MBER is especially discriminative on the subsets it is designed to stress, including long-range implicit affect, high-dependency memory levels, trajectory-based reasoning, and adversarial settings. These findings suggest that memory supports affective interpretation not simply by providing more history, but by enabling more selective, grounded, and context-sensitive use of past interaction
- Abstract(参考訳): 時間の経過とともにユーザと対話するAIアシスタントは、ユーザの現在の感情状態を適切にかつ個人的な応答するために解釈する必要がある。
しかし、この能力は十分に評価されていない。
既存の感情データセットは、主に局所的または即時的な影響を評価するが、長期記憶ベンチマークは、事実的リコール、時間的一貫性、知識更新に重点を置いている。
その結果、現在のリソースは、モデルが記憶されたインタラクション履歴を使用してユーザの現在の感情状態を解釈できるかどうかをテストするための限定的なサポートを提供する。
本稿では,感情認識のためのA-MBER(Affective Memory Benchmark for Emotion Recognition)を提案する。
A-MBERは、記憶されたマルチセッションインタラクション履歴に根ざした現在の感情解釈に焦点を当てている。
相互作用軌跡と指定されたアンカーターンが与えられた場合、モデルはユーザの現在の感情状態を推測し、歴史的に関連する証拠を特定し、その解釈を根拠として正当化しなければならない。
ベンチマークは、長期計画、会話生成、アノテーション、質問構築、最終パッケージングなど、明確な中間表現を備えたステージ付きパイプラインを通じて構築される。
判断、検索、説明のタスクをサポートし、モダリティの劣化や不十分なエビデンス条件といった堅牢性の設定をサポートする。
実験では、統一されたフレームワーク内のローカルコンテキスト、ロングコンテキスト、検索メモリ、構造化メモリ、ゴールドエビデンス条件を比較した。
その結果、A-MBERは特に、長距離暗黙的な影響、高依存性メモリレベル、軌道に基づく推論、敵の設定など、強調されるサブセットで識別可能であることが示された。
これらの知見は,記憶が情緒的解釈をサポートすることを示唆するだけでなく,過去の相互作用のより選択的,基礎的,文脈に敏感な利用を可能にすることによって,記憶が感情的解釈を支援することを示唆している。
関連論文リスト
- PERMA: Benchmarking Personalized Memory Agents via Event-Driven Preference and Realistic Task Environments [72.02445514666428]
静的な嗜好リコールを超えてペルマの一貫性を評価するためのベンチマークであるPERMAを紹介する。
PerMAは、複数のセッションとドメインにまたがる時間的に順序付けられたインタラクションイベントと、時間とともに好みに関連するクエリで構成されている。
実験により、関連するインタラクションをリンクすることで、高度なメモリシステムはより正確な好みを抽出し、トークン消費を減らすことができることが示された。
論文 参考訳(メタデータ) (2026-03-24T14:04:11Z) - Memory Bear AI Memory Science Engine for Multimodal Affective Intelligence: A Technical Report [3.9870633524104107]
Memory Bear AI Memory Science Engineは、マルチモーダル感情インテリジェンスのためのメモリ中心のフレームワークである。
構造化メモリ形成、ワークメモリ集約、長期統合、メモリ駆動型検索、動的核融合校正、継続的なメモリ更新による処理を組織化する。
実験結果から、ベンチマークとビジネスグラウンド設定を比較した結果、一貫した利得が得られた。
論文 参考訳(メタデータ) (2026-03-18T10:23:00Z) - AdaMem: Adaptive User-Centric Memory for Long-Horizon Dialogue Agents [49.63422082885992]
長軸対話エージェントのための適応型ユーザ中心メモリフレームワークであるAdaMemを提案する。
AdaMemは対話履歴をワーキング、エピソディック、ペルソナ、グラフメモリに整理する。
LoCoMo と PERSONAMEM ベンチマーク上での AdaMem の評価を行った。
論文 参考訳(メタデータ) (2026-03-17T13:22:54Z) - Memory-guided Prototypical Co-occurrence Learning for Mixed Emotion Recognition [56.00118641432005]
本稿では,感情共起パターンを明示的にモデル化するメモリ誘導型プロトタイプ共起学習フレームワークを提案する。
人間の認知記憶システムに触発されて,意味レベルの共起関係を抽出するメモリ検索戦略を導入する。
本モデルは感情分布予測のための感情情報表現を学習する。
論文 参考訳(メタデータ) (2026-02-24T04:11:25Z) - MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - ES-MemEval: Benchmarking Conversational Agents on Personalized Long-Term Emotional Support [11.480342895892404]
大きな言語モデル (LLM) は会話エージェントとして大きな可能性を示している。
しかし、その有効性は、堅牢な長期記憶の欠陥によって制限されている。
ES-MemEvalは5つのコアメモリ機能を体系的に評価するベンチマークである。
EvoEmoは、パーソナライズされた長期的な感情的サポートのためのデータセットである。
論文 参考訳(メタデータ) (2026-02-02T09:58:26Z) - KnowMe-Bench: Benchmarking Person Understanding for Lifelong Digital Companions [13.246922338917601]
我々は、長文の自伝的物語から構築された公開リリース可能なベンチマークであるBenchNameを紹介する。
BenchNameは各物語をフラッシュバック対応のタイムアンコールストリームに再構成し、エビデンスにリンクされた質問でモデルを評価する。
論文 参考訳(メタデータ) (2026-01-08T09:11:33Z) - FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.18498389833308]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文 参考訳(メタデータ) (2025-06-18T17:06:28Z) - MADial-Bench: Towards Real-world Evaluation of Memory-Augmented Dialogue Generation [15.64077949677469]
メモリ拡張対話システム(MADS)の有効性を評価するための新しいメモリ拡張対話ベンチマーク(MADail-Bench)を提案する。
このベンチマークは2つのタスクを別々に評価する: メモリ検索とメモリ認識は、パッシブとプロアクティブの両方のメモリリコールデータを組み込んだものである。
このベンチマークにおける最先端の埋め込みモデルと大規模言語モデルの結果は、さらなる進歩の可能性を示している。
論文 参考訳(メタデータ) (2024-09-23T17:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。