論文の概要: EPR-GAIL: An EPR-Enhanced Hierarchical Imitation Learning Framework to Simulate Complex User Consumption Behaviors
- arxiv url: http://arxiv.org/abs/2503.06392v1
- Date: Sun, 09 Mar 2025 01:56:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:51:26.626086
- Title: EPR-GAIL: An EPR-Enhanced Hierarchical Imitation Learning Framework to Simulate Complex User Consumption Behaviors
- Title(参考訳): EPR-GAIL:複雑な消費行動のシミュレートを目的としたEPR強化階層型模倣学習フレームワーク
- Authors: Tao Feng, Yunke Zhang, Huandong Wang, Yong Li,
- Abstract要約: 本研究では,データ駆動型GAIL(Generative Adversarial Learning)手法の忠実さと信頼性を高めることを提案する。
EPR-GAILフレームワークの中核となる考え方は、ユーザの消費行動を複雑なEPR決定プロセスとしてモデル化することです。
オンラインプラットフォーム上での2つの実世界のユーザ消費行動データセットの実験では、EPR-GAILフレームワークが、データの忠実度において、最高の最先端ベースラインを19%以上上回っていることが示されている。
- 参考スコア(独自算出の注目度): 13.436303786475348
- License:
- Abstract: User consumption behavior data, which records individuals' online spending history at various types of stores, has been widely used in various applications, such as store recommendation, site selection, and sale forecasting. However, its high worth is limited due to deficiencies in data comprehensiveness and changes of application scenarios. Thus, generating high-quality sequential consumption data by simulating complex user consumption behaviors is of great importance to real-world applications. Two branches of existing sequence generation methods are both limited in quality. Model-based methods with simplified assumptions fail to model the complex decision process of user consumption, while data-driven methods that emulate real-world data are prone to noises, unobserved behaviors, and dynamic decision space. In this work, we propose to enhance the fidelity and trustworthiness of the data-driven Generative Adversarial Imitation Learning (GAIL) method by blending it with the Exploration and Preferential Return EPR model . The core idea of our EPR-GAIL framework is to model user consumption behaviors as a complex EPR decision process, which consists of purchase, exploration, and preference decisions. Specifically, we design the hierarchical policy function in the generator as a realization of the EPR decision process and employ the probability distributions of the EPR model to guide the reward function in the discriminator. Extensive experiments on two real-world datasets of user consumption behaviors on an online platform demonstrate that the EPR-GAIL framework outperforms the best state-of-the-art baseline by over 19\% in terms of data fidelity. Furthermore, the generated consumption behavior data can improve the performance of sale prediction and location recommendation by up to 35.29% and 11.19%, respectively, validating its advantage for practical applications.
- Abstract(参考訳): 個人のオンライン消費履歴を様々な種類の店舗で記録するユーザ消費行動データは,店舗推薦,サイト選択,販売予測など,様々なアプリケーションで広く利用されている。
しかし、データの包括性やアプリケーションシナリオの変更が不足しているため、その価値は限られている。
したがって、複雑なユーザ消費行動をシミュレートすることで、高品質なシーケンシャルな消費データを生成することは、現実世界のアプリケーションにとって非常に重要である。
既存のシーケンス生成手法の2つのブランチはどちらも品質が制限されている。
単純化された仮定を持つモデルベースの手法は、ユーザ消費の複雑な決定プロセスのモデル化に失敗し、一方、実世界のデータをエミュレートするデータ駆動方式は、ノイズ、観測されない振る舞い、動的決定空間に起因する。
本研究では,データ駆動型GAIL(Generative Adversarial Imitation Learning)法の忠実さと信頼性を高めることを提案する。
当社のEPR-GAILフレームワークの中核となる考え方は、購入、探索、嗜好決定からなる複雑なEPR決定プロセスとして、ユーザ消費行動のモデル化です。
具体的には、EPR決定プロセスの実現としてジェネレータの階層的ポリシー関数を設計し、EPRモデルの確率分布を用いて、識別器の報酬関数を導出する。
オンラインプラットフォーム上での2つの実世界のユーザ消費行動データセットに関する大規模な実験は、EPR-GAILフレームワークがデータの忠実度において、最高の最先端ベースラインを19倍以上上回っていることを示している。
さらに、生成した消費行動データは、販売予測と位置推薦の性能をそれぞれ35.29%、11.19%向上させ、実用上の優位性を検証することができる。
関連論文リスト
- Adaptive Data Optimization: Dynamic Sample Selection with Scaling Laws [59.03420759554073]
本稿では,オンライン手法でデータ分散を最適化するアルゴリズムであるAdaptive Data Optimization (ADO)を導入する。
ADOは外部の知識やプロキシモデル、モデル更新の変更を必要としない。
ADOは、ドメインごとのスケーリング法則を使用して、トレーニング中の各ドメインの学習ポテンシャルを推定し、データ混合を調整する。
論文 参考訳(メタデータ) (2024-10-15T17:47:44Z) - Towards Cost Sensitive Decision Making [14.279123976398926]
本研究では,環境から機能を積極的に獲得し,意思決定の質と確実性を向上するRLモデルを考察する。
本稿では,Active-Acquisition POMDPを提案する。
積極的に獲得された部分観測環境においてエージェントを支援するとともに,探索・探索ジレンマを軽減するため,モデルベースアプローチを開発した。
論文 参考訳(メタデータ) (2024-10-04T19:48:23Z) - Revisiting BPR: A Replicability Study of a Common Recommender System Baseline [78.00363373925758]
我々は,BPRモデルの特徴を考察し,その性能への影響を示し,オープンソースのBPR実装について検討する。
分析の結果,これらの実装とオリジナルのBPR論文の矛盾が明らかとなり,特定の実装に対して最大50%の性能低下がみられた。
BPRモデルは、トップnのレコメンデーションタスクにおける最先端メソッドに近いパフォーマンスレベルを達成でき、特定のデータセット上でもパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-09-21T18:39:53Z) - Consumer Transactions Simulation through Generative Adversarial Networks [0.07373617024876725]
本稿では,合成小売取引データを生成するためのGAN(Generative Adversarial Networks)の革新的な応用について述べる。
我々は、SKUデータをGANアーキテクチャに統合し、より洗練された埋め込み手法を用いて従来の手法から切り離す。
その結果, 実物と実物を比較することで, シミュレーショントランザクションにおける現実性の向上が示された。
論文 参考訳(メタデータ) (2024-08-07T09:45:24Z) - Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - Federated Privacy-preserving Collaborative Filtering for On-Device Next
App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。
古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。
提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文 参考訳(メタデータ) (2023-02-05T10:29:57Z) - Out-of-sample scoring and automatic selection of causal estimators [0.0]
本稿では,CATEの場合と器楽変数問題の重要な部分集合に対する新しいスコアリング手法を提案する。
私たちはそれを、DoWhyとEconMLライブラリに依存するオープンソースパッケージで実装しています。
論文 参考訳(メタデータ) (2022-12-20T08:29:18Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - On the estimation of discrete choice models to capture irrational
customer behaviors [4.683806391173103]
我々は、部分的にランク付けされた好みを使って、トランザクションデータから合理的で不合理な顧客タイプを効率的にモデル化する方法を示す。
提案手法の予測精度を評価する実験を幅広く行った。
論文 参考訳(メタデータ) (2021-09-08T19:19:51Z) - Maximizing Cumulative User Engagement in Sequential Recommendation: An
Online Optimization Perspective [26.18096797120916]
ユーザエンゲージメントの向上とユーザブラウジングの促進という、潜在的に矛盾する2つの目標をトレードオフするためには、しばしば必要となる。
より長いユーザブラウジング期間と高いユーザエンゲージメントを明示的にトレードオフする,フレキシブルで実用的なフレームワークを提案する。
このアプローチは大規模なEコマースプラットフォームにデプロイされ、累積クリックの7%以上の改善が達成されている。
論文 参考訳(メタデータ) (2020-06-02T09:02:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。