論文の概要: Online Bidding in Repeated Non-Truthful Auctions under Budget and ROI
Constraints
- arxiv url: http://arxiv.org/abs/2302.01203v1
- Date: Thu, 2 Feb 2023 16:30:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 13:15:57.421279
- Title: Online Bidding in Repeated Non-Truthful Auctions under Budget and ROI
Constraints
- Title(参考訳): 予算・ROI制約下における繰り返し非実効入札におけるオンライン入札
- Authors: Matteo Castiglioni, Andrea Celli, Christian Kroer
- Abstract要約: 繰り返し行われる非実情オークションにおける予算・ROI制約入札の問題について検討する。
双方の入力と逆入力の条件下での保証のないベスト・オブ・ザ・ワールドズ・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 54.28273783164608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online advertising platforms typically use auction mechanisms to allocate ad
placements. Advertisers participate in a series of repeated auctions, and must
select bids that will maximize their overall rewards while adhering to certain
constraints. We focus on the scenario in which the advertiser has budget and
return-on-investment (ROI) constraints. We investigate the problem of budget-
and ROI-constrained bidding in repeated non-truthful auctions, such as
first-price auctions, and present a best-of-both-worlds framework with
no-regret guarantees under both stochastic and adversarial inputs. By utilizing
the notion of interval regret, we demonstrate that our framework does not
require knowledge of specific parameters of the problem which could be
difficult to determine in practice. Our proof techniques can be applied to both
the adversarial and stochastic cases with minimal modifications, thereby
providing a unified perspective on the two problems. In the adversarial
setting, we also show that it is possible to loosen the traditional requirement
of having a strictly feasible solution to the offline optimization problem at
each round.
- Abstract(参考訳): オンライン広告プラットフォームは通常、広告の配置を競売メカニズムで割り当てる。
広告主は繰り返しオークションに参加し、一定の制約に固執しながら報酬を最大化する入札を選択する必要がある。
我々は、広告主が予算とROI(Return-on-investment)制約を持つシナリオに焦点を当てる。
原価競売などの非実効的競売における予算・ROI制約入札の問題について検討し, 確率的, 対角的両入力下での保証のないベスト・オブ・ワールド・フレームワークを提案する。
本研究では,時間的後悔という概念を生かして,現実的な判断が難しい問題に対する特定のパラメータの知識を必要としないことを示す。
本手法は, 対角的, 確率的双方に最小限の修正を加えて適用でき, 両問題に対する統一的な視点を与えることができる。
また,各ラウンドにおけるオフライン最適化問題に対して,厳密な解決が可能であるという従来の要件を緩和することも可能であることを示す。
関連論文リスト
- Efficient Methods for Non-stationary Online Learning [67.3300478545554]
本稿では, 動的後悔と適応的後悔を最適化する効率的な手法を提案し, ラウンド当たりの投影回数を$mathcalO(log T)$から$ $1$まで削減した。
本手法は,パラメータフリーオンライン学習において開発された還元機構を基礎として,非定常オンライン手法に非自明なツイストを必要とする。
論文 参考訳(メタデータ) (2023-09-16T07:30:12Z) - Model-based Constrained MDP for Budget Allocation in Sequential
Incentive Marketing [28.395877073390434]
逐次インセンティブマーケティングは、オンラインビジネスにとって顧客を獲得し、忠誠心を高め、売上を伸ばすための重要なアプローチである。
予算制約下でのリターンを最大化するインセンティブを効果的に割り当てる方法については、文献ではあまり研究されていない。
本稿では,2項探索とモデルベース計画を組み合わせた効率的な学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-02T08:10:45Z) - Direct Heterogeneous Causal Learning for Resource Allocation Problems in
Marketing [20.9377115817821]
マーケティングは、ユーザのエンゲージメントを高め、プラットフォーム収益を改善するための重要なメカニズムである。
マーケティングにおける意思決定問題は資源配分問題として定式化され、数十年にわたって研究されてきた。
既存の作業は通常、解法を2つの完全に分離された段階、すなわち機械学習(ML)と操作研究(OR)に分割する。
論文 参考訳(メタデータ) (2022-11-28T19:27:34Z) - A Unifying Framework for Online Optimization with Long-Term Constraints [62.35194099438855]
我々は,意思決定者が長期的制約の対象となる一連の意思決定をしなければならないオンライン学習問題について検討する。
目標は、全報酬を最大化し、同時に、$T$ラウンド全体で小さな累積違反を達成することである。
本稿では,この一般クラス問題に対して,未知のモデルに基づいて報酬と制約が選択された場合と,各ラウンドで敵が選択した場合の双方において,最良世界型アルゴリズムを提示する。
論文 参考訳(メタデータ) (2022-09-15T16:59:19Z) - Online Learning with Knapsacks: the Best of Both Worlds [54.28273783164608]
オンライン学習の課題として,意思決定者が,リソース制約の有限セットに違反することなく,期待する報酬を最大化したい,という課題を提起する。
当社のフレームワークは,意思決定者がそのエビデンスを柔軟かつコスト論的に扱えるようにします。
論文 参考訳(メタデータ) (2022-02-28T12:10:48Z) - Online Allocation with Two-sided Resource Constraints [44.5635910908944]
我々は,要求が順次到着する,リソース制約の低いオンラインアロケーション問題を考える。
提案手法では, リクエスト全体を知るオフライン問題に対して, 1-O (fracepsilonalpha-epsilon)$-competitive ratioを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-28T02:21:06Z) - Online Optimization and Learning in Uncertain Dynamical Environments
with Performance Guarantees [2.729854122688235]
未知かつ不確実な動的環境におけるオンライン最適化と学習問題を解決するための新しいフレームワークを提案する。
このフレームワークは、オンラインの決定を定量的に堅牢にしながら、不確実な動的環境を同時に学ぶことができます。
論文 参考訳(メタデータ) (2021-02-18T01:49:06Z) - An Online Method for A Class of Distributionally Robust Optimization
with Non-Convex Objectives [54.29001037565384]
本稿では,オンライン分散ロバスト最適化(DRO)のクラスを解決するための実用的なオンライン手法を提案する。
本研究は,ネットワークの堅牢性向上のための機械学習における重要な応用を実証する。
論文 参考訳(メタデータ) (2020-06-17T20:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。