論文の概要: Free Lunch! Retrospective Uplift Modeling for Dynamic Promotions
Recommendation within ROI Constraints
- arxiv url: http://arxiv.org/abs/2008.06293v2
- Date: Mon, 17 Aug 2020 06:31:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 16:54:58.718015
- Title: Free Lunch! Retrospective Uplift Modeling for Dynamic Promotions
Recommendation within ROI Constraints
- Title(参考訳): フリーランチ!
ROI制約内における動的促進勧告のためのふりかえり昇降モデリング
- Authors: Dmitri Goldenberg, Javier Albert, Lucas Bernardi and Pablo Estevez
- Abstract要約: オンライン旅行プラットフォーム(OTP)では、部屋のアップグレード、無料食事、輸送サービスなどが人気である。
プロモーションは通常、制御されていない場合、持続不可能になるコストを発生させる。
プロモーションが実行可能となるためには、関連するコストは、一定の財政的制約の中で漸進的な収入によってバランスをとらなければならない。
本稿では, Knapsack Problem の定式化に頼って, 新たなアップリフトモデリング手法を提案する。
- 参考スコア(独自算出の注目度): 9.733174472837275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Promotions and discounts have become key components of modern e-commerce
platforms. For online travel platforms (OTPs), popular promotions include room
upgrades, free meals and transportation services. By offering these promotions,
customers can get more value for their money, while both the OTP and its travel
partners may grow their loyal customer base. However, the promotions usually
incur a cost that, if uncontrolled, can become unsustainable. Consequently, for
a promotion to be viable, its associated costs must be balanced by incremental
revenue within set financial constraints. Personalized treatment assignment can
be used to satisfy such constraints.
This paper introduces a novel uplift modeling technique, relying on the
Knapsack Problem formulation, that dynamically optimizes the incremental
treatment outcome subject to the required Return on Investment (ROI)
constraints. The technique leverages Retrospective Estimation, a modeling
approach that relies solely on data from positive outcome examples. The method
also addresses training data bias, long term effects, and seasonality
challenges via online-dynamic calibration. This approach was tested via offline
experiments and online randomized controlled trials at Booking .com - a leading
OTP with millions of customers worldwide, resulting in a significant increase
in the target outcome while staying within the required financial constraints
and outperforming other approaches.
- Abstract(参考訳): プロモーションと割引は、現代のeコマースプラットフォームの重要な要素となっている。
オンライン旅行プラットフォーム(OTP)では、部屋のアップグレード、無料食事、輸送サービスなどが人気である。
これらのプロモーションを提供することで、顧客は自分のお金に対してより多くの価値を得ることができる一方、OPPとその旅行パートナーは忠実な顧客ベースを成長させることができる。
しかし、通常、プロモーションは、制御不能な場合、持続不可能となるコストを発生させる。
したがって、プロモーションが実行可能となるためには、その関連するコストは、一定の財政的制約内でのインクリメンタルな収入によってバランスをとらなければならない。
パーソナライズされた治療割り当ては、そのような制約を満たすために使用できる。
本稿では,要求される投資収益(ROI)制約に基づく漸進的処理結果を動的に最適化する,Knapsack Problem の定式化による新しいアップリフトモデリング手法を提案する。
このテクニックは、ポジティブな結果の例からのデータのみに依存するモデリングアプローチであるふりかえり見積もりを活用する。
この方法は、トレーニングデータバイアス、長期効果、およびオンライン・ダイナミック・キャリブレーションによる季節問題にも対処する。
このアプローチはオフライン実験とオンラインランダム化制御試験を通じてテストされた。
結果として、必要な金銭的制約内に留まり、他のアプローチよりも優れたパフォーマンスを保ちながら、目標とする結果が大幅に増加します。
関連論文リスト
- Dynamic Rewarding with Prompt Optimization Enables Tuning-free Self-Alignment of Language Models [54.381650481255235]
我々は,Prompt Optimization (O) を用いた動的リワードによる自己アライメントのための新しいチューニング不要アプローチを提案する。
提案手法は,LLMを反復的に自己改善し,最適アライメント命令を作成可能な検索ベース最適化フレームワークを活用する。
近年の8つのLCMのオープンおよびクローズドソースに関する実証評価により,DRPOはアライメント性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-11-13T16:15:38Z) - End-to-End Cost-Effective Incentive Recommendation under Budget Constraint with Uplift Modeling [12.160403526724476]
本稿では,予算制約下でのエンド・ツー・エンド・エンド・コスト・エフェクティブ・インセンティブ・レコメンデーション(E3IR)モデルを提案する。
具体的には、アップリフト予測モジュールと微分可能なアロケーションモジュールの2つのモジュールから構成される。
E3IRは既存の2段階アプローチに比べてアロケーション性能が向上する。
論文 参考訳(メタデータ) (2024-08-21T13:48:00Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - Democratizing LLMs: An Exploration of Cost-Performance Trade-offs in
Self-Refined Open-Source Models [53.859446823312126]
SoTAは7Bから65Bまでのさまざまなサイズのオープンソースモデルを平均して、ベースラインのパフォーマンスから8.2%改善している。
厳密に言えば、Vicuna-7Bのような非常に小さなメモリフットプリントを持つモデルでさえ、全体的な11.74%の改善と、高い創造性、オープンエンドタスクの25.39%の改善を示している。
論文 参考訳(メタデータ) (2023-10-11T15:56:00Z) - A Meta-learning based Stacked Regression Approach for Customer Lifetime
Value Prediction [3.6002910014361857]
顧客ライフタイムバリュー(英:Customer Lifetime Value、CLV)とは、取引/購入の合計金額である。
CLVは、銀行、保険、オンラインエンタテインメント、ゲーム、Eコマースなど、いくつかの異なるビジネスドメインでアプリケーションを見つける。
本稿では,効果的かつ包括的かつシンプルかつ解釈可能なシステムを提案する。
論文 参考訳(メタデータ) (2023-08-07T14:22:02Z) - Incremental Profit per Conversion: a Response Transformation for Uplift
Modeling in E-Commerce Promotions [1.7640556247739623]
本稿では,購入時にのみ費用が発生する応答依存コストによるプロモーションに焦点を当てた。
既存のアップリフトモデルアプローチでは、メタラーナーのような複数のモデルをトレーニングする必要がしばしばあります。
本稿では, ユニット・エコノミクスにおける促進キャンペーンの効率を向上する新たな指標であるIncrmental Profit per Conversion(IPC)を紹介する。
論文 参考訳(メタデータ) (2023-06-23T19:46:02Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - SaFormer: A Conditional Sequence Modeling Approach to Offline Safe
Reinforcement Learning [64.33956692265419]
オフラインセーフなRLは、現実世界のアプリケーションにエージェントをデプロイする上で、非常に実用的な関連性を持っています。
そこで我々は,SaFormerと呼ばれる新しいオフラインセーフなRLアプローチを提案する。
論文 参考訳(メタデータ) (2023-01-28T13:57:01Z) - BCRLSP: An Offline Reinforcement Learning Framework for Sequential
Targeted Promotion [8.499811428928071]
本稿では,利用者に送付される現金ボーナスの価値を決定するために,予算制約付き逐次促進学習フレームワークを提案する。
BCRLSPは, 長期顧客維持率が高く, 各種ベースラインよりも低コストであることを示す。
論文 参考訳(メタデータ) (2022-07-16T00:10:12Z) - E-Commerce Promotions Personalization via Online Multiple-Choice
Knapsack with Uplift Modeling [1.027974860479791]
本稿では,オンライン制約付きマルチコースプロモーションパーソナライズ問題について検討する。
本研究は,オンライン多重選択Knapsack問題としてこの問題を定式化する。
予算制約の遵守を保証するリアルタイム適応手法を提案する。
論文 参考訳(メタデータ) (2021-08-11T15:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。