論文の概要: SimPersona: Learning Discrete Buyer Personas from Raw Clickstreams for Grounded E-Commerce Agents
- arxiv url: http://arxiv.org/abs/2605.14205v1
- Date: Thu, 14 May 2026 00:01:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.544468
- Title: SimPersona: Learning Discrete Buyer Personas from Raw Clickstreams for Grounded E-Commerce Agents
- Title(参考訳): SimPersona: 現地のEコマースエージェントのために、生クリックストリームから個別の購入者ペルソナを学習する
- Authors: Zahra Zanjani Foumani, Alberto Castelo, Shuang Xie, Ted Chaiwachirasak, Han Li, Lingyun Wang,
- Abstract要約: SimPersonaは、歴史的トラフィックから個別のバイヤータイプを学習し、コンパクトなペルソナトークンとしてLLMベースのWebエージェントに公開する新しいフレームワークである。
SimPersonaは、実際の買い手とのコンバージョンレートのアライメントで78%を達成し、買い手の種類によって解釈可能な振る舞いの変化を示し、目標指向のショッピングタスクにおいて8倍のパラメータでベースラインを上回っている。
- 参考スコア(独自算出の注目度): 6.722556076605006
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based web agents can navigate live storefronts, yet they often collapse to a single "average buyer" policy, failing to capture the heterogeneous and distributional nature of real buyer populations. Existing personalization methods rely on hand-crafted prompt-based personas that are brittle, difficult to scale, context-inefficient, and unable to faithfully represent population-level behavior. We introduce SimPersona, a novel framework that learns discrete buyer types from historical traffic and exposes them to LLM-based web agents as compact persona tokens. Given raw clickstreams, a behavior-aware VQ-VAE induces a discrete buyer-type space that captures the statistical structure of real buyer behavior and merchant-specific buyer population distributions. To provide behavior-specific guidance to LLM-based web agents, SimPersona maps each learned buyer type to a dedicated persona token in the LLM agent vocabulary and fine-tunes the agent with these tokens on real browsing traces. At inference, each synthetic buyer is assigned to a learned buyer type with a single encoder forward pass, requiring no retraining or store-specific prompt engineering. For population-level simulation, SimPersona samples buyer types from each merchant's empirical distribution over the learned VQ-VAE codebook and instantiates agents with the corresponding persona tokens, preserving merchant-specific buyer population distributions. Evaluated on $8.37$M buyers across $42$ held-out live storefronts, SimPersona achieves $78\%$ conversion-rate alignment with real buyers, exhibits interpretable behavioral variation across buyer types, and outperforms a baseline with $8\times$ more parameters on goal-oriented shopping tasks. We further release an open-source data pipeline that converts raw e-commerce event logs into buyer representations and agent-training traces.
- Abstract(参考訳): LLMベースのウェブエージェントは、ライブストアフロントをナビゲートできるが、しばしば一つの「平均購入者」ポリシーに崩壊する。
既存のパーソナライズ手法は、手作りのプロンプトベースのペルソナに頼っている。
シムペルソナ(SimPersona)は、歴史的トラフィックから個別のバイヤータイプを学習し、コンパクトなペルソナトークンとしてLLMベースのWebエージェントに公開する新しいフレームワークである。
生クリックストリームが与えられた場合、行動認識型VQ-VAEは、実際の購入者行動の統計構造と商人固有の購入者人口分布をキャプチャする個別の購入者型空間を誘導する。
LLMベースのWebエージェントに対する行動特異的ガイダンスを提供するため、SimPersonaは、学習した購入者のタイプをLLMエージェント語彙内の専用のペルソナトークンにマッピングし、実際のブラウジングトレース上でこれらのトークンでエージェントを微調整する。
推測では、各合成バイヤーは、学習されたバイヤータイプに、単一のエンコーダフォワードパスで割り当てられ、再トレーニングやストア固有のプロンプトエンジニアリングを必要としない。
人口レベルのシミュレーションでは、SimPersonaは学習したVQ-VAEコードブック上で各商人の経験的分布から購入者タイプをサンプリングし、エージェントを対応するペルソナトークンでインスタンス化し、商店固有の購入者人口分布を保存する。
シムペルソナは、42ドル(約4万4000円)のライブ店舗で837ドル(約8万7000円)の買い手から評価され、実際の買い手とのコンバージョンレートの調整に78セント(約7万7000円)を達成し、買い手の種類によって解釈可能な行動変化を示し、目標指向のショッピングタスクにおいて8ドル(約8万7000円)以上のパラメータでベースラインを上回ります。
さらに、生のEコマースイベントログをバイヤー表現やエージェントトレーニングトレースに変換する、オープンソースのデータパイプラインをリリースしています。
関連論文リスト
- SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators [63.68151307455963]
本稿では,マルチモーダル大規模言語モデル(MLLM)の現実的,ペルソナ主導の顧客行動のシミュレート能力を評価するためのフレームワークとテストベッドであるSalesSimを紹介する。
我々は,シミュレータの動作とペルソナ仕様との整合性,および会話品質を測定する。
実験により,UserGRPOは,会話品質を改善しつつ,ベースラインモデルの整合性を13.8%向上させることを示した。
論文 参考訳(メタデータ) (2026-05-08T17:59:23Z) - Measuring and Mitigating the Distributional Gap Between Real and Simulated User Behaviors [61.610957638373826]
本研究では,実際のユーザ行動とシミュレーションユーザ行動の分布ギャップを計測する手法を提案する。
実会話とシミュレーション会話のデータセットが与えられた場合,本手法は各会話からユーザ行動の表現を抽出する。
ほとんどのシミュレータも同様に振る舞うが、いくつかは独立している。
論文 参考訳(メタデータ) (2026-05-08T15:09:25Z) - What Makes a Sale? Rethinking End-to-End Seller--Buyer Retail Dynamics with LLM Agents [22.408631930364788]
RetailSimは、このパイプラインを統一された環境でモデル化するエンドツーエンドの小売シミュレーションフレームワークである。
本稿では,ペルソナ推論,売り手と買い手のインタラクション分析,販売戦略評価など,意思決定指向のユースケースを通じて,その実用性を実証する。
論文 参考訳(メタデータ) (2026-04-06T06:38:35Z) - SimGym: Traffic-Grounded Browser Agents for Offline A/B Testing in E-Commerce [8.496158383334]
SimGymは、リアルタイムブラウザで動作するLarge Language Modelエージェントをベースとした、トラフィックグラウンドの合成バイヤーを使用した、オフラインA/Bテストのためのスケーラブルなシステムである。
SimGymは、プロダクションインタラクションデータから、ショップごとのバイヤープロファイルとインテントを抽出する。
我々はSimGymを、共同創業者のコントロールの下で主要なeコマースプラットフォーム上での実際のUI変更による実際の人間的な結果に対して検証する。
論文 参考訳(メタデータ) (2026-02-01T21:23:04Z) - OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation [56.47029531207105]
OPERAは、ユーザペルソナ、ブラウザの観察、きめ細かいWebアクション、そして自己報告されたジャストインタイム論理を包括的にキャプチャする最初のパブリックデータセットである。
我々は,現在のLCMがユーザの次の行動と合理的性をどの程度予測できるかを評価するための最初のベンチマークを確立する。
論文 参考訳(メタデータ) (2025-06-05T21:37:49Z) - You Are What You Bought: Generating Customer Personas for E-commerce Applications [22.012818753574905]
本稿では,顧客ペルソナの概念を紹介する。
顧客ペルソナは、特定の購入行動や嗜好の多面的かつ人間可読な特徴を提供する。
我々は,ペルソナをベースとした表現の性能を,レコメンデーションタスクや顧客セグメンテーションタスクの正確性と堅牢性の観点から評価する。
NDCG@KとF1-Score@Kの両面で、顧客のペルソナ表現の統合により、最先端のグラフベースのレコメンデーションモデルが最大12%向上することがわかった。
論文 参考訳(メタデータ) (2025-04-24T06:59:16Z) - PAARS: Persona Aligned Agentic Retail Shoppers [2.8737584376365355]
電子商取引では、行動データは意思決定のために収集される。
匿名化された履歴ショッピングデータを自動マイニングすることで、合成ショッピングエージェントを作成するフレームワークを提案する。
本稿では,自動エージェントA/Bテストのためのフレームワークの初期応用について紹介し,その結果と人的結果を比較した。
論文 参考訳(メタデータ) (2025-03-31T15:41:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。