論文の概要: Dynamic Pricing with Volume Discounts in Online Settings
- arxiv url: http://arxiv.org/abs/2211.09612v1
- Date: Thu, 17 Nov 2022 16:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 16:55:53.423249
- Title: Dynamic Pricing with Volume Discounts in Online Settings
- Title(参考訳): オンライン設定におけるボリュームディスカウントによる動的価格設定
- Authors: Marco Mussi, Gianmarco Genalti, Alessandro Nuara, Francesco Trov\`o,
Marcello Restelli and Nicola Gatti
- Abstract要約: 本稿では,電子商取引における客観的機能が利益であり,取引データのみが利用可能である場合の価格設定に焦点を当てる。
我々の研究は、異なるボリューム閾値で最適な価格を定め、異なるクラスのユーザーに提供する価格戦略を見つけることを目的としている。
我々は、オンライン形式でデータを活用できる2段階のオンライン学習アルゴリズムBを設計する。
- 参考スコア(独自算出の注目度): 102.00782184214326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: According to the main international reports, more pervasive industrial and
business-process automation, thanks to machine learning and advanced analytic
tools, will unlock more than 14 trillion USD worldwide annually by 2030. In the
specific case of pricing problems-which constitute the class of problems we
investigate in this paper-, the estimated unlocked value will be about 0.5
trillion USD per year. In particular, this paper focuses on pricing in
e-commerce when the objective function is profit maximization and only
transaction data are available. This setting is one of the most common in
real-world applications. Our work aims to find a pricing strategy that allows
defining optimal prices at different volume thresholds to serve different
classes of users. Furthermore, we face the major challenge, common in
real-world settings, of dealing with limited data available. We design a
two-phase online learning algorithm, namely PVD-B, capable of exploiting the
data incrementally in an online fashion. The algorithm first estimates the
demand curve and retrieves the optimal average price, and subsequently it
offers discounts to differentiate the prices for each volume threshold. We ran
a real-world 4-month-long A/B testing experiment in collaboration with an
Italian e-commerce company, in which our algorithm PVD-B-corresponding to A
configuration-has been compared with human pricing specialists-corresponding to
B configuration. At the end of the experiment, our algorithm produced a total
turnover of about 300 KEuros, outperforming the B configuration performance by
about 55%. The Italian company we collaborated with decided to adopt our
algorithm for more than 1,200 products since January 2022.
- Abstract(参考訳): 主要国際レポートによると、機械学習と高度な分析ツールのおかげで、より広範囲な産業とビジネスプロセスの自動化が、2030年までに毎年14兆USドル以上をアンロックする。
価格問題(この論文で調査する問題のクラスを構成する)の具体的な場合、推定アンロックされた値は年間0.5兆米ドルである。
特に本論文は,利益の最大化と取引データのみを対象とする電子商取引における価格設定に焦点を当てた。
この設定は、現実世界のアプリケーションでもっとも一般的なもののひとつです。
我々の研究は、異なるボリューム閾値で最適な価格を定義するための価格戦略を見つけることを目的としている。
さらに、利用可能な限られたデータを扱うという、現実世界で一般的な大きな課題に直面しています。
我々は2段階のオンライン学習アルゴリズムであるPVD-Bを設計し、オンライン方式でデータを段階的に活用する。
アルゴリズムはまず需要曲線を推定し、最適な平均価格を取得し、その後、各ボリューム閾値の価格を区別するために割引を提供する。
私たちは、イタリアのeコマース企業と共同で、実際の4ヶ月にわたるA/Bテスト実験を実施しました。
実験終了時,本アルゴリズムは約300keuroのトータルターンオーバーを行い,b構成性能を約55%上回った。
協力したイタリアの会社は2022年1月以来1200以上の製品でこのアルゴリズムを採用することに決めました。
関連論文リスト
- A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Cost-Sensitive Multi-Fidelity Bayesian Optimization with Transfer of Learning Curve Extrapolation [55.75188191403343]
各ユーザが事前に定義した機能であるユーティリティを導入し,BOのコストと性能のトレードオフについて述べる。
このアルゴリズムをLCデータセット上で検証した結果,従来のマルチファイルBOや転送BOベースラインよりも優れていた。
論文 参考訳(メタデータ) (2024-05-28T07:38:39Z) - Reinforcement Learning from Human Feedback with Active Queries [67.27150911254155]
現在の強化学習アプローチは、多くの場合、大量の人間による嗜好データを必要とする。
本稿では,能動学習の成功に触発されたクエリ効率の高いRLHF手法を提案する。
実験の結果,ADPOは人間の好みに対するクエリの約半分しか作成していないが,最先端のDPO法の性能と一致していることがわかった。
論文 参考訳(メタデータ) (2024-02-14T18:58:40Z) - Learning-augmented Online Algorithm for Two-level Ski-rental Problem [8.381344684943212]
本研究では,3つの支払いオプションのうちの1つを選択することで,複数の項目に対する要求の順序を満たす必要がある2段階のスキーレンタル問題について検討する。
我々は、機械学習予測を頑健なオンラインアルゴリズムに組み込むことにより、学習増強アルゴリズム(LADTSR)を開発した。
論文 参考訳(メタデータ) (2024-02-09T16:10:54Z) - Data Market Design through Deep Learning [16.505791601397185]
収益最適化データ市場の設計におけるディープラーニングの適用について紹介する。
我々の実験は、この新しいディープラーニングフレームワークが、既知のすべてのソリューションを理論からほぼ正確に複製できることを示した。
論文 参考訳(メタデータ) (2023-10-31T00:21:09Z) - Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-27T17:52:06Z) - Human-in-the-loop: Provably Efficient Preference-based Reinforcement
Learning with General Function Approximation [107.54516740713969]
本研究は,RL(Human-in-the-loop reinforcement learning)を軌道的嗜好で検討する。
各ステップで数値的な報酬を受ける代わりに、エージェントは人間の監督者から軌道上のペアよりも優先される。
一般関数近似を用いたPbRLの楽観的モデルベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-23T09:03:24Z) - Adaptively Optimize Content Recommendation Using Multi Armed Bandit
Algorithms in E-commerce [4.143179903857126]
我々は3つの古典的MABアルゴリズム、epsilon-greedy, Thompson sample (TS), and upper confidence bound 1 (UCB1) を用いて動的コンテンツの推薦を行う。
3つのMABアルゴリズムの累積報酬と、実際のA/Bテストデータセットを用いた1000以上の試行を比較する。
電子商取引における遅延報酬問題を克服するために,バッチ更新MABアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-30T21:03:38Z) - Online Apprenticeship Learning [58.45089581278177]
見習い学習(AL)では、コスト関数にアクセスせずにマルコフ決定プロセス(MDP)が与えられます。
目標は、事前に定義されたコスト関数のセットで専門家のパフォーマンスに一致するポリシーを見つけることです。
ミラー下降型ノンレグレットアルゴリズムを2つ組み合わせることで,OAL問題を効果的に解くことができることを示す。
論文 参考訳(メタデータ) (2021-02-13T12:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。