論文の概要: Emotional Support Evaluation Framework via Controllable and Diverse Seeker Simulator
- arxiv url: http://arxiv.org/abs/2601.07698v1
- Date: Mon, 12 Jan 2026 16:30:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.634821
- Title: Emotional Support Evaluation Framework via Controllable and Diverse Seeker Simulator
- Title(参考訳): 制御可能な横型シーカシミュレータによる感情支援評価フレームワーク
- Authors: Chaewon Heo, Cheyon Jin, Yohan Jo,
- Abstract要約: 探索行動の基盤となる9つの心理的特徴と言語的特徴によって駆動される制御可能な探索シミュレータを提案する。
本シミュレータは,既存手法と比較して,プロファイルの順応性や行動の多様性に優れる。
- 参考スコア(独自算出の注目度): 12.68911492082634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As emotional support chatbots have recently gained significant traction across both research and industry, a common evaluation strategy has emerged: use help-seeker simulators to interact with supporter chatbots. However, current simulators suffer from two critical limitations: (1) they fail to capture the behavioral diversity of real-world seekers, often portraying them as overly cooperative, and (2) they lack the controllability required to simulate specific seeker profiles. To address these challenges, we present a controllable seeker simulator driven by nine psychological and linguistic features that underpin seeker behavior. Using authentic Reddit conversations, we train our model via a Mixture-of-Experts (MoE) architecture, which effectively differentiates diverse seeker behaviors into specialized parameter subspaces, thereby enhancing fine-grained controllability. Our simulator achieves superior profile adherence and behavioral diversity compared to existing approaches. Furthermore, evaluating 7 prominent supporter models with our system uncovers previously obscured performance degradations. These findings underscore the utility of our framework in providing a more faithful and stress-tested evaluation for emotional support chatbots.
- Abstract(参考訳): 感情的なサポートチャットボットは、最近、研究と産業の両方で大きな注目を集めているため、一般的な評価戦略が生まれている。
しかし、現状のシミュレーターは、(1)現実世界の探索者の行動多様性を捉えず、しばしば過度に協力的だと表現し、(2)特定の探索者のプロファイルをシミュレートするために必要な制御性に欠ける、という2つの限界に悩まされている。
これらの課題に対処するために、探索行動の基盤となる9つの心理的・言語的特徴によって駆動される制御可能な探索シミュレータを提案する。
Redditの真正な会話を用いて、我々はMixture-of-Experts (MoE)アーキテクチャを用いてモデルをトレーニングし、多様な探究行動から特定のパラメータ部分空間を効果的に区別し、きめ細かい制御性を向上させる。
本シミュレータは,既存手法と比較して,プロファイルの順応性や行動の多様性に優れる。
さらに,本システムによる7つの顕著なサポータモデルの評価により,これまで明らかにされていなかった性能劣化が明らかになった。
これらの知見は,感情支援チャットボットに対する,より忠実でストレステストされた評価を提供する上で,我々のフレームワークの有用性を裏付けるものである。
関連論文リスト
- Adversarial Training for Failure-Sensitive User Simulation in Mental Health Dialogue Optimization [1.964225730132177]
効果的なシミュレータの重要な特性は、評価したシステムの障害モードを公開する能力である。
本稿では,ジェネレータ(ユーザシミュレータ)とディスクリミネータの競合ダイナミクスを用いて,ユーザシミュレータリアリズムを改善するための逆トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-23T21:21:08Z) - Data-driven simulator of multi-animal behavior with unknown dynamics via offline and online reinforcement learning [8.835312357110618]
生物学における現実的なマルチアニマルシミュレーションの重要な課題は、未知の現実世界の遷移モデルとそのシミュレーションモデルの間のギャップを埋めることである。
深層強化学習と対実シミュレーションに基づくマルチ動物行動のためのデータ駆動シミュレータを提案する。
論文 参考訳(メタデータ) (2025-10-12T05:08:26Z) - SimulatorArena: Are User Simulators Reliable Proxies for Multi-Turn Evaluation of AI Assistants? [61.07963107032645]
大規模言語モデル(LLM)は、対話型アプリケーションでますます使われている。
人間の評価は、マルチターン会話におけるパフォーマンスを評価するためのゴールドスタンダードのままである。
我々は、909の注釈付き人間とLLMの会話を2つの対話タスクで行うベンチマークであるSimulatorArenaを紹介した。
論文 参考訳(メタデータ) (2025-10-06T23:17:44Z) - Non-Collaborative User Simulators for Tool Agents [12.294827535425414]
本研究では,非協調行動の4つのカテゴリをシミュレートする新しいユーザシミュレータアーキテクチャを提案する。
我々のMultiWOZと$tau$-benchの実験は、非コラボレーションユーザと出会う際に、最先端のツールエージェントの性能が著しく低下していることを明らかにした。
論文 参考訳(メタデータ) (2025-09-27T05:06:17Z) - Behavioral Exploration: Learning to Explore via In-Context Adaptation [53.92981562916783]
我々は、過去の観察の文脈で条件付けられた専門家の行動を予測し、専門家の行動がこの文脈とどのように関係しているかを測定するために、長期コンテキスト生成モデルを訓練する。
これにより、モデルが専門家の振る舞いを模倣するだけでなく、過去の相互作用の歴史を文脈に反映することで、これまで選択されたものと異なる専門家の振る舞いを選択することができる。
本手法は実環境におけるロボット操作作業だけでなく,シミュレーションロコモーションと操作設定の両方において有効であることを示す。
論文 参考訳(メタデータ) (2025-07-11T21:36:19Z) - AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation [31.85345530649749]
アナジェント(AnnaAgent)は、第三次記憶を備えた感情的・認知的動的エージェントシステムである。
本稿では,AnnaAgentが,既存のベースラインよりも心理学的カウンセリングにおいて,より現実的な探索シミュレーションを実現していることを示す。
論文 参考訳(メタデータ) (2025-05-31T13:15:51Z) - User Behavior Simulation with Large Language Model based Agents [116.74368915420065]
LLMベースのエージェントフレームワークを提案し,実際のユーザ動作をシミュレートするサンドボックス環境を設計する。
実験結果から,本手法のシミュレーション行動は実人の行動に非常に近いことが判明した。
論文 参考訳(メタデータ) (2023-06-05T02:58:35Z) - Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards
Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。
正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。
人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文 参考訳(メタデータ) (2022-01-27T22:15:56Z) - Modality-Transferable Emotion Embeddings for Low-Resource Multimodal
Emotion Recognition [55.44502358463217]
本稿では、上記の問題に対処するため、感情を埋め込んだモダリティ変換可能なモデルを提案する。
我々のモデルは感情カテゴリーのほとんどで最先端のパフォーマンスを達成する。
私たちのモデルは、目に見えない感情に対するゼロショットと少数ショットのシナリオにおいて、既存のベースラインよりも優れています。
論文 参考訳(メタデータ) (2020-09-21T06:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。