Fugu-MT 論文翻訳(概要): Modeling User Retention through Generative Flow Networks

論文の概要: Modeling User Retention through Generative Flow Networks

arxiv url: http://arxiv.org/abs/2406.06043v1
Date: Mon, 10 Jun 2024 06:22:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 17:09:20.803267
Title: Modeling User Retention through Generative Flow Networks
Title（参考訳）: 生成フローネットワークによるユーザ保持のモデル化
Authors: Ziru Liu, Shuchang Liu, Bin Yang, Zhenghai Xue, Qingpeng Cai, Xiangyu Zhao, Zijian Zhang, Lantao Hu, Han Li, Peng Jiang,
Abstract要約: フローベースのモデリング技術は、ユーザセッションで推奨される各項目に対する保持報酬をバックプロパガントすることができる。従来の学習目標と組み合わされたフローは、最終的には、即時フィードバックとユーザ保持の両方に対して、非カウントの累積報酬を最適化した。
参考スコア（独自算出の注目度）: 34.74982897470852
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recommender systems aim to fulfill the user's daily demands. While most existing research focuses on maximizing the user's engagement with the system, it has recently been pointed out that how frequently the users come back for the service also reflects the quality and stability of recommendations. However, optimizing this user retention behavior is non-trivial and poses several challenges including the intractable leave-and-return user activities, the sparse and delayed signal, and the uncertain relations between users' retention and their immediate feedback towards each item in the recommendation list. In this work, we regard the retention signal as an overall estimation of the user's end-of-session satisfaction and propose to estimate this signal through a probabilistic flow. This flow-based modeling technique can back-propagate the retention reward towards each recommended item in the user session, and we show that the flow combined with traditional learning-to-rank objectives eventually optimizes a non-discounted cumulative reward for both immediate user feedback and user retention. We verify the effectiveness of our method through both offline empirical studies on two public datasets and online A/B tests in an industrial platform.
Abstract（参考訳）: レコメンダシステムは、ユーザの日々の要求を満たすことを目的としている。既存の研究はシステムへのユーザのエンゲージメントの最大化に重点を置いているが、最近は、ユーザがサービスに戻ってくる頻度も、レコメンデーションの品質と安定性を反映している、と指摘されている。しかし、このユーザの保持行動の最適化は簡単ではないため、難易度の高い離脱・復帰行動、スパース・遅延信号、リコメンデーションリストの各項目に対するユーザの保持行動と即時フィードバックの関係の不確実性など、いくつかの課題が生じる。本研究では,保持信号がユーザのセッション終了満足度を総合的に推定するものとみなし,確率的フローを通じてその信号を評価することを提案する。このフローベースモデリング手法は,ユーザセッションの各推奨項目に対するリテンション報酬をバックプロファイリングし,従来の学習目標と組み合わせたフローが,即時フィードバックとユーザリテンションの両方に対して非カウント累積報酬を最適化することを示す。産業用プラットフォームにおける2つの公開データセットとオンラインA/Bテストのオフライン実験により,本手法の有効性を検証した。

関連論文リスト

RecGPT Technical Report [57.84251629878726]
本稿では,レコメンデーションパイプラインの中心にユーザの意図を配置する次世代フレームワークRecGPTを提案する。 RecGPTは、大きな言語モデルをユーザ関心のマイニング、アイテム検索、説明生成のキーステージに統合する。オンライン実験では、RecGPTが利害関係者間で一貫したパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2025-07-30T17:55:06Z)
Churn-Aware Recommendation Planning under Aggregated Preference Feedback [6.261444979025644]
本稿では,近年の規制と技術の変化を動機とした逐次的意思決定問題について考察する。我々はRec-APCモデルを導入し、匿名ユーザを既知の先行ユーザ型から抽出する。最適ポリシが有限時間で純粋な利用に収束することを証明し、それらを効率的に計算するための分岐とバウンドのアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-07-06T19:22:47Z)
Reinforcement Learning from User Feedback [28.335218244885706]
本稿では,大規模言語モデルとユーザの好みを整合させるフレームワークであるReinforcement Learning from User Feedback (RLUF)を紹介する。報奨モデル P[Love] をトレーニングし, LLM 応答がラブ反応を受ける可能性を予測する。 P[Love]は肯定的なフィードバックの増加を予測し,将来のユーザ行動の信頼性の高いオフライン評価手段として機能することを示す。
論文参考訳（メタデータ） (2025-05-20T22:14:44Z)
Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文参考訳（メタデータ） (2025-05-02T04:01:31Z)
Recommendation and Temptation [3.734925590025741]
本稿では、二元的行動を考慮した新しいユーザモデルを提案し、最適な推薦戦略を開発する。提案手法は,MovieLensデータセットから得られた実世界のデータに基づいて,合成シミュレーションとシミュレーションの両方を用いて評価する。
論文参考訳（メタデータ） (2024-12-13T22:44:22Z)
Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-09T04:20:15Z)
Learning from Negative User Feedback and Measuring Responsiveness for Sequential Recommenders [13.762960304406016]
シーケンシャルレコメンデータのトレーニング目標に、明示的かつ暗黙的なネガティブなユーザフィードバックを導入する。大規模産業レコメンデーションシステムを用いた実演実験により,本手法の有効性を実証する。
論文参考訳（メタデータ） (2023-08-23T17:16:07Z)
Reinforcing User Retention in a Billion Scale Short Video Recommender System [21.681785801465328]
短いビデオプラットフォームは、興味深いコンテンツをユーザーに推薦することで、急速にユーザー成長を遂げた。この勧告の目的は、ユーザ保持の最適化であり、DAU(Daily Active Users)の成長を促進することである。
論文参考訳（メタデータ） (2023-02-03T13:25:43Z)
Learning to Suggest Breaks: Sustainable Optimization of Long-Term User Engagement [12.843340232167266]
本稿では,レコメンデーションにおけるブレークの役割について検討し,最適なブレークポリシーを学習するための枠組みを提案する。推奨力学は正と負の両方のフィードバックに影響を受けやすいという概念に基づいて,ロトカ・ボルテラの力学系としてレコメンデーションを提唱した。
論文参考訳（メタデータ） (2022-11-24T13:14:29Z)
Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文参考訳（メタデータ） (2022-11-17T19:00:24Z)
Personalizing Intervened Network for Long-tailed Sequential User Behavior Modeling [66.02953670238647]
タイルユーザーは、共同トレーニング後のヘッドユーザーよりも大幅に品質の低いレコメンデーションに悩まされる。テールユーザーで個別に訓練されたモデルは、限られたデータのために依然として劣った結果が得られる。本稿では,テールユーザの推薦性能を大幅に向上させる新しい手法を提案する。
論文参考訳（メタデータ） (2022-08-19T02:50:19Z)
Denoising User-aware Memory Network for Recommendation [11.145186013006375]
我々はDUMN(Denoising User-Aware memory network)という新しいCTRモデルを提案する。 DUMNは明示的なフィードバックの表現を使用して、暗黙的なフィードバックの表現を浄化し、暗黙的なフィードバックを効果的に軽視する。 2つの実際のEコマースユーザ行動データセットの実験は、DUMNが最先端のベースラインよりも大幅に改善されていることを示している。
論文参考訳（メタデータ） (2021-07-12T14:39:36Z)
PURS: Personalized Unexpected Recommender System for Improving User Satisfaction [76.98616102965023]
本稿では、予期せぬことを推奨プロセスに組み込んだ、新しいPersonalized Unexpected Recommender System(PURS)モデルについて述べる。 3つの実世界のデータセットに対する大規模なオフライン実験は、提案されたPURSモデルが最先端のベースラインアプローチを大幅に上回っていることを示している。
論文参考訳（メタデータ） (2021-06-05T01:33:21Z)
Maximizing Cumulative User Engagement in Sequential Recommendation: An Online Optimization Perspective [26.18096797120916]
ユーザエンゲージメントの向上とユーザブラウジングの促進という、潜在的に矛盾する2つの目標をトレードオフするためには、しばしば必要となる。より長いユーザブラウジング期間と高いユーザエンゲージメントを明示的にトレードオフする,フレキシブルで実用的なフレームワークを提案する。このアプローチは大規模なEコマースプラットフォームにデプロイされ、累積クリックの7%以上の改善が達成されている。
論文参考訳（メタデータ） (2020-06-02T09:02:51Z)
Reward Constrained Interactive Recommendation with Natural Language Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文参考訳（メタデータ） (2020-05-04T16:23:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。