論文の概要: Should I send this notification? Optimizing push notifications decision
making by modeling the future
- arxiv url: http://arxiv.org/abs/2202.08812v1
- Date: Thu, 17 Feb 2022 18:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-18 16:39:34.550076
- Title: Should I send this notification? Optimizing push notifications decision
making by modeling the future
- Title(参考訳): この通知を送りましょうか。
将来をモデル化したプッシュ通知決定の最適化
- Authors: Conor O'Brien, Huasen Wu, Shaodan Zhai, Dalin Guo, Wenzhe Shi,
Jonathan J Hunt
- Abstract要約: 最も推奨されるシステムは、ユーザの即時応答に基づいて最適化されるミオピック(myopic)である。
これは、長期的なユーザ満足度の作成など、真の目標と誤解する可能性がある。
この作業では,特に推奨システム決定の長期的な影響が強いモバイルプッシュ通知に重点を置いています。
- 参考スコア(独自算出の注目度): 4.476351684070796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most recommender systems are myopic, that is they optimize based on the
immediate response of the user. This may be misaligned with the true objective,
such as creating long term user satisfaction. In this work we focus on mobile
push notifications, where the long term effects of recommender system decisions
can be particularly strong. For example, sending too many or irrelevant
notifications may annoy a user and cause them to disable notifications.
However, a myopic system will always choose to send a notification since
negative effects occur in the future. This is typically mitigated using
heuristics. However, heuristics can be hard to reason about or improve, require
retuning each time the system is changed, and may be suboptimal. To counter
these drawbacks, there is significant interest in recommender systems that
optimize directly for long-term value (LTV). Here, we describe a method for
maximising LTV by using model-based reinforcement learning (RL) to make
decisions about whether to send push notifications. We model the effects of
sending a notification on the user's future behavior. Much of the prior work
applying RL to maximise LTV in recommender systems has focused on session-based
optimization, while the time horizon for notification decision making in this
work extends over several days. We test this approach in an A/B test on a major
social network. We show that by optimizing decisions about push notifications
we are able to send less notifications and obtain a higher open rate than the
baseline system, while generating the same level of user engagement on the
platform as the existing, heuristic-based, system.
- Abstract(参考訳): 最も推奨されるシステムは、ユーザの即時応答に基づいて最適化されるミオピックである。
これは、長期的なユーザ満足度の作成など、真の目標と誤解する可能性がある。
この作業では,特に推奨システム決定の長期的な影響が強いモバイルプッシュ通知に重点を置いています。
例えば、過剰な通知や無関係な通知を送ると、ユーザーに迷惑をかけ、通知を無効にすることがある。
しかし、将来マイナス効果が発生するため、筋電図システムは常に通知を送信することを選択する。
これは典型的にはヒューリスティックを用いて緩和される。
しかし、ヒューリスティックスは推論や改善が困難であり、システムが変更されるたびに修正が必要であり、亜最適かもしれない。
これらの欠点に対処するため、長期的価値(LTV)を直接最適化するレコメンデーターシステムに大きな関心がある。
本稿では,モデルベース強化学習(RL)を用いたLTVの最大化手法について述べる。
我々は,通知がユーザの将来の行動に与える影響をモデル化する。
推薦システムにおけるLTVの最大化にRLを適用した以前の作業の多くはセッションベースの最適化に重点を置いていたが、この作業における通知決定の時間的地平は数日にわたって続いている。
我々は、大手ソーシャルネットワーク上でのA/Bテストでこのアプローチをテストする。
プッシュ通知に関する決定を最適化することで,既存のヒューリスティックなシステムと同じレベルのユーザエンゲージメントをプラットフォーム上で生成しながら,通知の送信を減らし,ベースラインシステムよりも高いオープンレートを得ることができることを示す。
関連論文リスト
- Improving Recommendation Fairness via Data Augmentation [66.4071365614835]
協調フィルタリングに基づくレコメンデーションは、すべてのユーザの過去の行動データからユーザの好みを学習し、意思決定を容易にするために人気がある。
ユーザの敏感な属性に応じて異なるユーザグループに対して等しく機能しない場合には,レコメンダシステムは不公平であると考えられる。
本稿では,データ拡張の観点から,レコメンデーションフェアネスを改善する方法について検討する。
論文 参考訳(メタデータ) (2023-02-13T13:11:46Z) - PrefRec: Recommender Systems with Human Preferences for Reinforcing
Long-term User Engagement [36.95056214316392]
我々は、人間の嗜好(または嗜好に基づくレコメンダシステム)を備えた新しいパラダイム、レコメンダシステムを提案する。
PrefRecでは、複雑な報酬工学を回避しつつ、長期的な目標を最適化する上でRLの利点を完全に活用できます。
論文 参考訳(メタデータ) (2022-12-06T06:21:17Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - FedGRec: Federated Graph Recommender System with Lazy Update of Latent
Embeddings [108.77460689459247]
プライバシー問題を軽減するためのフェデレートグラフレコメンダシステム(FedGRec)を提案する。
本システムでは,ユーザとサーバは,ユーザとアイテムに対する遅延埋め込みを明示的に記憶する。
我々は,遅延埋め込みを相互作用グラフの欠落のプロキシとして用いることの有効性を検証するために,広範な実験的な評価を行った。
論文 参考訳(メタデータ) (2022-10-25T01:08:20Z) - A State Transition Model for Mobile Notifications via Survival Analysis [10.638942431625381]
通知の有効性を定量的に評価する状態遷移フレームワークを提案する。
ログ線形構造とワイブル分布を仮定したバッジ通知のサバイバルモデルを構築した。
この結果は,ロジスティック回帰モデルよりもアプリケーションの柔軟性が高く,予測精度が優れていることを示す。
論文 参考訳(メタデータ) (2022-07-07T05:38:39Z) - Multi-objective Optimization of Notifications Using Offline
Reinforcement Learning [1.2303635283131926]
我々はマルコフ決定過程として準リアルタイム通知決定問題を定式化する。
逐次通知決定を最適化するエンドツーエンドのオフライン強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T00:53:08Z) - PinnerFormer: Sequence Modeling for User Representation at Pinterest [60.335384724891746]
我々は、ユーザの将来的なエンゲージメントを予測するためにトレーニングされたユーザ表現であるPinnerFormerを紹介する。
従来のアプローチとは異なり、新しい密集した全アクション損失を通じて、モデリングをバッチインフラストラクチャに適応させます。
その結果,1日に1回発生するバッチユーザ埋め込みと,ユーザがアクションを行うたびに発生するリアルタイムユーザ埋め込みとの間には,大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2022-05-09T18:26:51Z) - Offline Reinforcement Learning for Mobile Notifications [1.965345368500676]
モバイル通知システムは、オンラインプラットフォームにおけるユーザエンゲージメントの推進と維持において重要な役割を担っている。
通知システムにおけるほとんどの機械学習アプリケーションは、応答予測モデルを中心に構築されている。
我々は、強化学習は、パフォーマンスとイテレーションのスピードの観点から、通知システムにとってより良いフレームワークであると主張する。
論文 参考訳(メタデータ) (2022-02-04T22:22:22Z) - Improving Conversational Question Answering Systems after Deployment
using Feedback-Weighted Learning [69.42679922160684]
本稿では,二元的ユーザフィードバックを用いた初期教師付きシステムを改善するために,重要サンプリングに基づくフィードバック重み付き学習を提案する。
当社の作業は,実際のユーザとのインタラクションを活用し,デプロイ後の会話システムを改善する可能性を開くものだ。
論文 参考訳(メタデータ) (2020-11-01T19:50:34Z) - Reward Constrained Interactive Recommendation with Natural Language
Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。
具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。
提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文 参考訳(メタデータ) (2020-05-04T16:23:34Z) - A Snooze-less User-Aware Notification System for Proactive
Conversational Agents [6.4378876455245235]
通知をインテリジェントに発行し、抑制し、集約するアラートおよび通知フレームワークを提案する。
私たちのフレームワークはバックエンドサービスとしてデプロイできますが、アクティブな会話エージェントに統合するのに適しています。
論文 参考訳(メタデータ) (2020-03-04T14:31:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。