論文の概要: Reinforced Imitative Graph Representation Learning for Mobile User
Profiling: An Adversarial Training Perspective
- arxiv url: http://arxiv.org/abs/2101.02634v1
- Date: Thu, 7 Jan 2021 17:10:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 13:39:01.472680
- Title: Reinforced Imitative Graph Representation Learning for Mobile User
Profiling: An Adversarial Training Perspective
- Title(参考訳): モバイルユーザプロファイリングのための強化された模倣グラフ表現学習--敵対的学習の視点から
- Authors: Dongjie Wang, Pengyang Wang, Kunpeng Liu, Yuanchun Zhou, Charles
Hughes, Yanjie Fu
- Abstract要約: ヒトモビリティモデリングパイプラインにおけるユーザの特性を定量化するための重要なコンポーネントであるモバイルユーザプロファイリングの問題について検討する。
強化学習を活用した模倣型モバイルユーザプロファイリングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.829562421373712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the problem of mobile user profiling, which is a
critical component for quantifying users' characteristics in the human mobility
modeling pipeline. Human mobility is a sequential decision-making process
dependent on the users' dynamic interests. With accurate user profiles, the
predictive model can perfectly reproduce users' mobility trajectories. In the
reverse direction, once the predictive model can imitate users' mobility
patterns, the learned user profiles are also optimal. Such intuition motivates
us to propose an imitation-based mobile user profiling framework by exploiting
reinforcement learning, in which the agent is trained to precisely imitate
users' mobility patterns for optimal user profiles. Specifically, the proposed
framework includes two modules: (1) representation module, which produces state
combining user profiles and spatio-temporal context in real-time; (2) imitation
module, where Deep Q-network (DQN) imitates the user behavior (action) based on
the state that is produced by the representation module. However, there are two
challenges in running the framework effectively. First, epsilon-greedy strategy
in DQN makes use of the exploration-exploitation trade-off by randomly pick
actions with the epsilon probability. Such randomness feeds back to the
representation module, causing the learned user profiles unstable. To solve the
problem, we propose an adversarial training strategy to guarantee the
robustness of the representation module. Second, the representation module
updates users' profiles in an incremental manner, requiring integrating the
temporal effects of user profiles. Inspired by Long-short Term Memory (LSTM),
we introduce a gated mechanism to incorporate new and old user characteristics
into the user profile.
- Abstract(参考訳): 本稿では,人間の移動性モデリングパイプラインにおけるユーザの特性を定量化するための重要な要素である,モバイルユーザプロファイリングの問題点について考察する。
ヒューマンモビリティ(human mobility)は、ユーザの動的関心に依存する、逐次的な意思決定プロセスである。
正確なユーザープロファイルにより、予測モデルはユーザーの移動軌跡を完璧に再現することができる。
逆方向では、予測モデルがユーザのモビリティパターンを模倣できると、学習したユーザプロファイルも最適になる。
このような直感は、エージェントが最適なユーザプロファイルのためにユーザのモビリティパターンを正確に模倣するように訓練された強化学習を活用することで、模倣に基づくモバイルユーザプロファイルフレームワークを提案する動機となっている。
具体的には,(1)ユーザプロファイルと時空間をリアルタイムに組み合わせた状態を生成する表現モジュール,(2)Deep Q-network(DQN)が表現モジュールによって生成される状態に基づいてユーザ動作(アクション)を模倣する模倣モジュール,の2つのモジュールを含む。
しかし、効果的にフレームワークを実行するには2つの課題がある。
第一に、DQNにおけるエプシロン・グリード戦略は、エプシロン確率をランダムに選択することで探索・探索トレードオフを利用する。
このようなランダム性は表現モジュールにフィードバックし、学習したユーザプロファイルが不安定になる。
そこで本研究では,表現モジュールの堅牢性を保証するための対角的トレーニング戦略を提案する。
第2に、representationモジュールはユーザのプロファイルをインクリメンタルに更新し、ユーザプロファイルの時間的効果を統合する必要がある。
LSTM(Long-Short Term Memory)にヒントを得て,新しいユーザ特性と古いユーザ特性をユーザプロファイルに組み込むゲート機構を導入する。
関連論文リスト
- Prompt Tuning as User Inherent Profile Inference Machine [53.78398656789463]
本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。
プロファイル量子化コードブックは、プロファイル埋め込みによるモダリティギャップを協調IDにブリッジする。
4つの公開データセットの実験では、UserIP-Tuningは最先端のレコメンデーションアルゴリズムを上回っている。
論文 参考訳(メタデータ) (2024-08-13T02:25:46Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - PUNR: Pre-training with User Behavior Modeling for News Recommendation [26.349183393252115]
ニュースレコメンデーションは、ユーザーの行動に基づいてクリック行動を予測することを目的としている。
ユーザの表現を効果的にモデル化する方法が、望ましいニュースを推奨する鍵である。
本研究では,ユーザ行動マスキングとユーザ行動生成という2つのタスクを備えた教師なし事前学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-25T08:03:52Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - PinnerFormer: Sequence Modeling for User Representation at Pinterest [60.335384724891746]
我々は、ユーザの将来的なエンゲージメントを予測するためにトレーニングされたユーザ表現であるPinnerFormerを紹介する。
従来のアプローチとは異なり、新しい密集した全アクション損失を通じて、モデリングをバッチインフラストラクチャに適応させます。
その結果,1日に1回発生するバッチユーザ埋め込みと,ユーザがアクションを行うたびに発生するリアルタイムユーザ埋め込みとの間には,大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2022-05-09T18:26:51Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Reinforced Imitative Graph Learning for Mobile User Profiling [34.62314685532468]
模倣に基づくモバイルユーザプロファイリングフレームワークを提案する。
ユーザのプロファイルに基づいてユーザのモビリティを模倣するように自律エージェントに教える目的を考えると,ユーザプロファイルが最も正確である。
ユーザがPOIを訪問するイベントは、エージェントがユーザのモビリティをより正確に予測するのに役立つ新しい状態を構築する。
論文 参考訳(メタデータ) (2022-03-13T02:56:57Z) - Model Learning with Personalized Interpretability Estimation (ML-PIE) [2.862606936691229]
ハイステークアプリケーションは、AI生成モデルを解釈可能にする必要がある。
解釈可能なモデルの合成のための現在のアルゴリズムは、目的や正規化項に依存する。
本稿では,ユーザ向けにカスタマイズされたモデルの合成手法を提案する。
論文 参考訳(メタデータ) (2021-04-13T09:47:48Z) - Exploiting Behavioral Consistence for Universal User Representation [11.290137806288191]
我々は普遍的ユーザ表現モデルの開発に注力する。
得られた普遍表現には豊富な情報が含まれることが予想される。
行動データを普遍表現にエンコードする自己監視型ユーザモデリングネットワーク(SUMN)を提案する。
論文 参考訳(メタデータ) (2020-12-11T06:10:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。