論文の概要: When Large Language Model based Agent Meets User Behavior Analysis: A
Novel User Simulation Paradigm
- arxiv url: http://arxiv.org/abs/2306.02552v2
- Date: Mon, 18 Sep 2023 14:36:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 23:26:14.566420
- Title: When Large Language Model based Agent Meets User Behavior Analysis: A
Novel User Simulation Paradigm
- Title(参考訳): 大規模言語モデルに基づくエージェントがユーザ行動分析と出会う:新しいユーザシミュレーションパラダイム
- Authors: Lei Wang, Jingsen Zhang, Hao Yang, Zhiyuan Chen, Jiakai Tang, Zeyu
Zhang, Xu Chen, Yankai Lin, Ruihua Song, Wayne Xin Zhao, Jun Xu, Zhicheng
Dou, Jun Wang, Ji-Rong Wen
- Abstract要約: 大きな言語モデル(LLM)は目覚ましい成功を収め、人間のような知性を達成する大きな可能性を示している。
本稿では,LLMを用いたユーザシミュレーションの可能性を探るため,リコメンデータシステムを例に挙げる。
包括的シミュレーションでは,レコメンデーションシステム内での行動(アイテムブラウジングやクリックなど)だけでなく,友人のチャットやソーシャル広告といった外部の影響力要因も考慮している。
- 参考スコア(独自算出の注目度): 116.74368915420065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: User behavior analysis is crucial in human-centered AI applications. In this
field, the collection of sufficient and high-quality user behavior data has
always been a fundamental yet challenging problem. An intuitive idea to address
this problem is automatically simulating the user behaviors. However, due to
the subjective and complex nature of human cognitive processes, reliably
simulating the user behavior is difficult. Recently, large language models
(LLM) have obtained remarkable successes, showing great potential to achieve
human-like intelligence. We argue that these models present significant
opportunities for reliable user simulation, and have the potential to
revolutionize traditional study paradigms in user behavior analysis. In this
paper, we take recommender system as an example to explore the potential of
using LLM for user simulation. Specifically, we regard each user as an
LLM-based autonomous agent, and let different agents freely communicate, behave
and evolve in a virtual simulator called RecAgent. For comprehensively
simulation, we not only consider the behaviors within the recommender system
(\emph{e.g.}, item browsing and clicking), but also accounts for external
influential factors, such as, friend chatting and social advertisement. Our
simulator contains at most 1000 agents, and each agent is composed of a
profiling module, a memory module and an action module, enabling it to behave
consistently, reasonably and reliably. In addition, to more flexibly operate
our simulator, we also design two global functions including real-human playing
and system intervention. To evaluate the effectiveness of our simulator, we
conduct extensive experiments from both agent and system perspectives. In order
to advance this direction, we have released our project at
{https://github.com/RUC-GSAI/YuLan-Rec}.
- Abstract(参考訳): ユーザー行動分析は、人間中心のAIアプリケーションにおいて重要である。
この分野では、十分かつ高品質なユーザー行動データの収集は、常に根本的かつ困難な問題である。
この問題を解決する直感的なアイデアは、自動的にユーザの振る舞いをシミュレートすることだ。
しかし、人間の認知プロセスの主観的かつ複雑な性質から、ユーザーの行動を確実にシミュレートすることは困難である。
近年、大きな言語モデル (LLM) が顕著な成功を収め、人間のような知性を実現する大きな可能性を示している。
これらのモデルが信頼性の高いユーザシミュレーションに重要な機会をもたらし、ユーザ行動分析における従来の研究パラダイムに革命をもたらす可能性があると論じている。
本稿では,ユーザシミュレーションにおけるllm活用の可能性を探るために,レコメンダシステムを提案する。
具体的には、各ユーザをllmベースの自律エージェントとみなし、recagentと呼ばれる仮想シミュレータで、異なるエージェントが自由にコミュニケーションし、行動し、進化させる。
総合的なシミュレーションのために、推薦システム内の行動(例えば、項目のブラウジングやクリック)を考えるだけでなく、友人のチャットやソーシャル広告といった外部の影響要因についても考慮する。
シミュレータには少なくとも1000のエージェントが含まれており、各エージェントはプロファイリングモジュール、メモリモジュール、アクションモジュールで構成されており、一貫した、合理的かつ確実な動作を可能にする。
さらに,シミュレータをより柔軟に操作するために,実演とシステム介入を含む2つのグローバル関数を設計する。
シミュレータの有効性を評価するため,エージェントおよびシステムの観点から広範囲な実験を行った。
この方向性を進めるため、私たちはhttps://github.com/RUC-GSAI/YuLan-Rec}でプロジェクトをリリースしました。
関連論文リスト
- GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.00666003559324]
我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文 参考訳(メタデータ) (2024-10-06T05:02:23Z) - USimAgent: Large Language Models for Simulating Search Users [33.17004578463697]
本稿では,大規模言語モデルに基づくユーザ検索行動シミュレータUSimAgentを紹介する。
シミュレータは、検索中のユーザのクエリ、クリック、動作の停止をシミュレートすることができる。
実ユーザ行動データセットに関する実証調査では、シミュレータがクエリ生成において既存のメソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-14T07:40:54Z) - Human Simulacra: Benchmarking the Personification of Large Language Models [38.21708264569801]
大規模言語モデル(LLM)は、人間の知性の側面を忠実に模倣するシステムとして認識されている。
本稿では,仮想キャラクタのライフストーリーをゼロから構築するためのフレームワークを提案する。
実験により, 構築したシミュラクラは, 対象キャラクタと一致した擬人化応答を生成できることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:11:14Z) - BASES: Large-scale Web Search User Simulation with Large Language Model
based Agents [108.97507653131917]
BASESは、大きな言語モデル(LLM)を持つ新しいユーザーシミュレーションフレームワークである。
シミュレーションフレームワークは,大規模に独自のユーザプロファイルを生成することができ,その結果,多様な検索行動が生まれる。
WARRIORSは、中国語と英語の両方のバージョンを含む、Web検索ユーザ行動を含む、新しい大規模なデータセットである。
論文 参考訳(メタデータ) (2024-02-27T13:44:09Z) - LLM-driven Imitation of Subrational Behavior : Illusion or Reality? [3.2365468114603937]
既存の作業は、複雑な推論タスクに対処し、人間のコミュニケーションを模倣する大規模言語モデルの能力を強調している。
そこで本研究では,LLMを用いて人工人体を合成し,サブリレーショナル・エージェント・ポリシーを学習する手法を提案する。
我々は,4つの単純なシナリオを通して,サブリレータリティをモデル化するフレームワークの能力について実験的に評価した。
論文 参考訳(メタデータ) (2024-02-13T19:46:39Z) - Reinforcement Learning with Human Feedback for Realistic Traffic
Simulation [53.85002640149283]
効果的なシミュレーションの鍵となる要素は、人間の知識と整合した現実的な交通モデルの導入である。
本研究では,現実主義に対する人間の嗜好のニュアンスを捉えることと,多様な交通シミュレーションモデルを統合することの2つの主な課題を明らかにする。
論文 参考訳(メタデータ) (2023-09-01T19:29:53Z) - Exploring the Intersection of Large Language Models and Agent-Based
Modeling via Prompt Engineering [0.0]
大きな言語モデル(LLM)がこのボトルネックの潜在的な解決策として現れている。
本稿では,人間行動の予測可能なプロキシのシミュレーションを2つ提示する。
論文 参考訳(メタデータ) (2023-08-14T18:58:00Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - RoboTHOR: An Open Simulation-to-Real Embodied AI Platform [56.50243383294621]
インタラクティブで具体化された視覚AIの研究を民主化するためにRoboTHORを導入する。
シミュレーションで訓練されたモデルの性能は,シミュレーションと慎重に構築された物理アナログの両方で試験される場合,大きな差があることが示される。
論文 参考訳(メタデータ) (2020-04-14T20:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。