Fugu-MT 論文翻訳(概要): Should I send this notification? Optimizing push notifications decision making by modeling the future

論文の概要: Should I send this notification? Optimizing push notifications decision making by modeling the future

arxiv url: http://arxiv.org/abs/2202.08812v1
Date: Thu, 17 Feb 2022 18:27:17 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-18 16:39:34.550076
Title: Should I send this notification? Optimizing push notifications decision making by modeling the future
Title（参考訳）: この通知を送りましょうか。将来をモデル化したプッシュ通知決定の最適化
Authors: Conor O'Brien, Huasen Wu, Shaodan Zhai, Dalin Guo, Wenzhe Shi, Jonathan J Hunt
Abstract要約: 最も推奨されるシステムは、ユーザの即時応答に基づいて最適化されるミオピック(myopic)である。これは、長期的なユーザ満足度の作成など、真の目標と誤解する可能性がある。この作業では,特に推奨システム決定の長期的な影響が強いモバイルプッシュ通知に重点を置いています。
参考スコア（独自算出の注目度）: 4.476351684070796
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Most recommender systems are myopic, that is they optimize based on the immediate response of the user. This may be misaligned with the true objective, such as creating long term user satisfaction. In this work we focus on mobile push notifications, where the long term effects of recommender system decisions can be particularly strong. For example, sending too many or irrelevant notifications may annoy a user and cause them to disable notifications. However, a myopic system will always choose to send a notification since negative effects occur in the future. This is typically mitigated using heuristics. However, heuristics can be hard to reason about or improve, require retuning each time the system is changed, and may be suboptimal. To counter these drawbacks, there is significant interest in recommender systems that optimize directly for long-term value (LTV). Here, we describe a method for maximising LTV by using model-based reinforcement learning (RL) to make decisions about whether to send push notifications. We model the effects of sending a notification on the user's future behavior. Much of the prior work applying RL to maximise LTV in recommender systems has focused on session-based optimization, while the time horizon for notification decision making in this work extends over several days. We test this approach in an A/B test on a major social network. We show that by optimizing decisions about push notifications we are able to send less notifications and obtain a higher open rate than the baseline system, while generating the same level of user engagement on the platform as the existing, heuristic-based, system.
Abstract（参考訳）: 最も推奨されるシステムは、ユーザの即時応答に基づいて最適化されるミオピックである。これは、長期的なユーザ満足度の作成など、真の目標と誤解する可能性がある。この作業では,特に推奨システム決定の長期的な影響が強いモバイルプッシュ通知に重点を置いています。例えば、過剰な通知や無関係な通知を送ると、ユーザーに迷惑をかけ、通知を無効にすることがある。しかし、将来マイナス効果が発生するため、筋電図システムは常に通知を送信することを選択する。これは典型的にはヒューリスティックを用いて緩和される。しかし、ヒューリスティックスは推論や改善が困難であり、システムが変更されるたびに修正が必要であり、亜最適かもしれない。これらの欠点に対処するため、長期的価値(LTV)を直接最適化するレコメンデーターシステムに大きな関心がある。本稿では,モデルベース強化学習(RL)を用いたLTVの最大化手法について述べる。我々は,通知がユーザの将来の行動に与える影響をモデル化する。推薦システムにおけるLTVの最大化にRLを適用した以前の作業の多くはセッションベースの最適化に重点を置いていたが、この作業における通知決定の時間的地平は数日にわたって続いている。我々は、大手ソーシャルネットワーク上でのA/Bテストでこのアプローチをテストする。プッシュ通知に関する決定を最適化することで,既存のヒューリスティックなシステムと同じレベルのユーザエンゲージメントをプラットフォーム上で生成しながら,通知の送信を減らし,ベースラインシステムよりも高いオープンレートを得ることができることを示す。

関連論文リスト

Improving Sequential Recommenders through Counterfactual Augmentation of System Exposure [75.45798019935947]
シーケンシャルレコメンデーション(CaseRec)のためのシステム露出に対する反ファクト改善を提案する。 CaseRecは、異なる露出報酬を考慮に入れた強化学習を導入する。拡張項目に対するユーザフィードバック報酬を予測するために,トランスフォーマーベースのユーザシミュレータを提案する。
論文参考訳（メタデータ） (2025-04-18T05:46:27Z)
Prompt Tuning as User Inherent Profile Inference Machine [53.78398656789463]
本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。プロファイル量子化コードブックは、プロファイル埋め込みによるモダリティギャップを協調IDにブリッジする。 4つの公開データセットの実験では、UserIP-Tuningは最先端のレコメンデーションアルゴリズムを上回っている。
論文参考訳（メタデータ） (2024-08-13T02:25:46Z)
TIM: Temporal Interaction Model in Notification System [6.377444652197526]
本稿では,短時間のビデオアプリケーションKuaishouにおいて,CTRを1日ごとの時間帯で推定することにより,ユーザの行動パターンをモデル化するTIMを提案する。 TIMはユーザ行動を予測するための信頼性の高いツールであり,不適切な障害を引き起こすことなく,ユーザのエンゲージメントを著しく向上させる。
論文参考訳（メタデータ） (2024-06-11T08:53:15Z)
System-2 Recommenders: Disentangling Utility and Engagement in Recommendation Systems via Temporal Point-Processes [80.97898201876592]
本稿では,過去のコンテンツインタラクションが,自己興奮型ホークスプロセスに基づくユーザの到着率に影響を及ぼす生成モデルを提案する。そこで本研究では,システム1とシステム2のアンタングルを解消し,ユーザ利用によるコンテンツ最適化を可能にすることを解析的に示す。
論文参考訳（メタデータ） (2024-05-29T18:19:37Z)
Prompt Optimization with Human Feedback [69.95991134172282]
人間のフィードバックによる迅速な最適化問題(POHF)について検討する。我々は自動POHF(Automatic POHF)というアルゴリズムを導入する。その結果、APOHFは、少数の好みフィードバックインスタンスを用いて、効率的に適切なプロンプトを見つけることができることがわかった。
論文参考訳（メタデータ） (2024-05-27T16:49:29Z)
Interest Clock: Time Perception in Real-Time Streaming Recommendation System [14.993810545170343]
時間モデリングは、リコメンデーションシステムが時間変化を知覚し、時間の経過とともにユーザの動的嗜好をキャプチャすることを目的としている。ストリーミングレコメンデーションシステムには効果的な時間モデリング方法がない。本稿では,レコメンデーションシステムにおける時間情報を知覚するための,効果的で普遍的な手法であるInterest Clockを提案する。
論文参考訳（メタデータ） (2024-04-30T08:38:09Z)
Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文参考訳（メタデータ） (2022-11-17T19:00:24Z)
FedGRec: Federated Graph Recommender System with Lazy Update of Latent Embeddings [108.77460689459247]
プライバシー問題を軽減するためのフェデレートグラフレコメンダシステム(FedGRec)を提案する。本システムでは,ユーザとサーバは,ユーザとアイテムに対する遅延埋め込みを明示的に記憶する。我々は,遅延埋め込みを相互作用グラフの欠落のプロキシとして用いることの有効性を検証するために,広範な実験的な評価を行った。
論文参考訳（メタデータ） (2022-10-25T01:08:20Z)
A State Transition Model for Mobile Notifications via Survival Analysis [10.638942431625381]
通知の有効性を定量的に評価する状態遷移フレームワークを提案する。ログ線形構造とワイブル分布を仮定したバッジ通知のサバイバルモデルを構築した。この結果は,ロジスティック回帰モデルよりもアプリケーションの柔軟性が高く,予測精度が優れていることを示す。
論文参考訳（メタデータ） (2022-07-07T05:38:39Z)
Offline Reinforcement Learning for Mobile Notifications [1.965345368500676]
モバイル通知システムは、オンラインプラットフォームにおけるユーザエンゲージメントの推進と維持において重要な役割を担っている。通知システムにおけるほとんどの機械学習アプリケーションは、応答予測モデルを中心に構築されている。我々は、強化学習は、パフォーマンスとイテレーションのスピードの観点から、通知システムにとってより良いフレームワークであると主張する。
論文参考訳（メタデータ） (2022-02-04T22:22:22Z)
Reward Constrained Interactive Recommendation with Natural Language Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文参考訳（メタデータ） (2020-05-04T16:23:34Z)
A Snooze-less User-Aware Notification System for Proactive Conversational Agents [6.4378876455245235]
通知をインテリジェントに発行し、抑制し、集約するアラートおよび通知フレームワークを提案する。私たちのフレームワークはバックエンドサービスとしてデプロイできますが、アクティブな会話エージェントに統合するのに適しています。
論文参考訳（メタデータ） (2020-03-04T14:31:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。