論文の概要: Learning User Preferences Through Interaction for Long-Term Collaboration
- arxiv url: http://arxiv.org/abs/2601.02702v1
- Date: Tue, 06 Jan 2026 04:26:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.798894
- Title: Learning User Preferences Through Interaction for Long-Term Collaboration
- Title(参考訳): 長期協調のためのインタラクションによるユーザ嗜好の学習
- Authors: Shuhaib Mehri, Priyanka Kargupta, Tal August, Dilek Hakkani-Tür,
- Abstract要約: MultiSessionCollabは、エージェントがいかにユーザの好みを学習できるかを評価するベンチマークである。
本稿では,対話体験の蓄積に伴ってユーザの嗜好を持続・改善するメモリを備えた長期協調エージェントを提案する。
実験によると、メモリを装備するエージェントは、長期的なコラボレーションを改善し、タスクの成功率を高め、より効率的なインタラクションを実現し、ユーザの労力を削減できる。
- 参考スコア(独自算出の注目度): 21.397369232719484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As conversational agents accumulate experience collaborating with users, adapting to user preferences is essential for fostering long-term relationships and improving collaboration quality over time. We introduce MultiSessionCollab, a benchmark that evaluates how well agents can learn user preferences and leverage them to improve collaboration quality throughout multiple sessions. To develop agents that succeed in this setting, we present long-term collaborative agents equipped with a memory that persists and refines user preference as interaction experience accumulates. Moreover, we demonstrate that learning signals can be derived from user simulator behavior in MultiSessionCollab to train agents to generate more comprehensive reflections and update their memory more effectively. Extensive experiments show that equipping agents with memory improves long-term collaboration, yielding higher task success rates, more efficient interactions, and reduced user effort. Finally, we conduct a human user study that demonstrates that memory helps improve user experience in real-world settings.
- Abstract(参考訳): 会話エージェントはユーザとのコラボレーション経験を蓄積するので、長期的な関係を育み、時間とともにコラボレーションの質を向上させるためには、ユーザの好みに適応することが不可欠である。
我々はMultiSessionCollabというベンチマークを導入し、エージェントがユーザの好みをいかに学習し、それらを活用して複数のセッションを通してコラボレーション品質を向上させるかを評価する。
この設定を成功させるエージェントを開発するために,対話体験の蓄積に伴ってユーザの嗜好を持続・改善するメモリを備えた長期協調エージェントを提案する。
さらに,MultiSessionCollabのユーザシミュレータ動作から学習信号を抽出して,より包括的なリフレクションを生成し,メモリをより効率的に更新するようにエージェントを訓練できることを実証した。
大規模な実験では、メモリを装備するエージェントが長期的なコラボレーションを改善し、タスクの成功率を高め、より効率的なインタラクションを実現し、ユーザの労力を減らすことが示されている。
最後に,実環境において,メモリがユーザエクスペリエンスの向上に役立つことを示す,人間のユーザスタディを実施している。
関連論文リスト
- Mem-PAL: Towards Memory-based Personalized Dialogue Assistants for Long-term User-Agent Interaction [55.24448139349266]
PAL-Benchは、長期ユーザエージェントインタラクションにおけるサービス指向アシスタントのパーソナライズ機能を評価するために設計された新しいベンチマークである。
サービス指向のインタラクションをパーソナライズするために、階層的で異質なメモリフレームワークであるH$2$Memoryを提案する。
論文 参考訳(メタデータ) (2025-11-17T14:22:32Z) - ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory [57.517214479414726]
ReasoningBankは、エージェントの自己判断の成功と失敗の経験から一般化可能な推論戦略を抽出するメモリフレームワークである。
テスト時には、エージェントがReasoningBankから関連する記憶を取得してそのインタラクションを知らせ、新しい学習を統合することで、時間が経つにつれてより有能になる。
本稿では,エージェントのインタラクションエクスペリエンスをスケールアップすることにより,学習プロセスの高速化と多様化を図るメモリ対応テストタイムスケーリング(MaTTS)を提案する。
論文 参考訳(メタデータ) (2025-09-29T17:51:03Z) - UserBench: An Interactive Gym Environment for User-Centric Agents [110.77212949007958]
LLM(Large Language Models)ベースのエージェントは、推論とツールの使用において、目覚ましい進歩を遂げてきたが、ユーザと積極的にコラボレーションする能力はまだ未熟である。
マルチターン、選好駆動インタラクションにおいてエージェントを評価するために設計されたユーザ中心のベンチマークであるUserBenchを紹介する。
論文 参考訳(メタデータ) (2025-07-29T17:34:12Z) - Reinforce Lifelong Interaction Value of User-Author Pairs for Large-Scale Recommendation Systems [12.319127514687844]
本稿では,UAペア間の相互作用に基づいて,ユーザ-認証ペアのライフサイクルインタラクション値(RLIV-UA)の強化にRLを導入する。
オフライン実験とオンラインA/Bテストでは、RLIV-UAモデルは比較手法よりも高いユーザ満足度と高いプラットフォーム利益を達成する。
論文 参考訳(メタデータ) (2025-07-22T05:58:55Z) - CollabLLM: From Passive Responders to Active Collaborators [109.39122516993362]
大規模な言語モデルは、通常、次のターン報酬で訓練され、長期的な相互作用のために最適化する能力を制限する。
マルチターン・ヒューマン・LLMコラボレーションを強化する新奇で汎用的なトレーニングフレームワークであるCollabLLMを紹介する。
また、201人の審査員による大規模なユーザスタディを実施し、CollabLLMはユーザの満足度を17.6%向上し、ユーザ使用時間を10.4%削減します。
論文 参考訳(メタデータ) (2025-02-02T03:05:52Z) - Async Learned User Embeddings for Ads Delivery Optimization [24.104745716074262]
推薦システムでは、高品質なユーザ埋め込みは微妙な好みを捉え、正確な類似性計算を可能にし、時間とともに変化する好みに適応して関連性を維持することができる。
本稿では,Transformerのような大規模機能学習モジュールを用いて,シーケンスベースのマルチモーダルユーザアクティビティから,毎日数十億のユーザに対する高忠実度ユーザ埋め込みを非同期に学習することを提案する。
論文 参考訳(メタデータ) (2024-06-09T19:35:20Z) - A LLM-based Controllable, Scalable, Human-Involved User Simulator Framework for Conversational Recommender Systems [14.646529557978512]
Conversational Recommender System (CRS) はユーザからのリアルタイムフィードバックを利用して好みを動的にモデル化する。
LLM(Large Language Models)は、計算能力の新たな時代を迎えている。
ユーザシミュレータの動作を管理するCSHI(Controlable, scalable, and human-Involved)シミュレータフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-13T03:02:56Z) - Memory Sharing for Large Language Model based Agents [43.53494041932615]
本稿では,リアルタイムメモリフィルタ,ストレージ,検索を統合し,In-Context学習プロセスを強化するためのフレームワークであるMemory Sharingを紹介する。
実験の結果,MSフレームワークはオープンな質問に対処する際のエージェントの性能を大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-04-15T17:57:30Z) - AgentCF: Collaborative Learning with Autonomous Language Agents for
Recommender Systems [112.76941157194544]
本稿では,エージェントベースの協調フィルタリングにより,レコメンデータシステムにおけるユーザとイテムのインタラクションをシミュレートするエージェントCFを提案する。
我々は、ユーザだけでなく、アイテムをエージェントとして、創造的に考慮し、両方のエージェントを同時に最適化する協調学習アプローチを開発します。
全体として、最適化されたエージェントは、ユーザ・イテム、ユーザ・ユーザ・ユーザ、アイテム・イテム、集合的インタラクションなど、フレームワーク内での多様なインタラクションの振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-13T16:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。