論文の概要: A pragmatic policy learning approach to account for users' fatigue in repeated auctions
- arxiv url: http://arxiv.org/abs/2407.10504v1
- Date: Mon, 15 Jul 2024 07:53:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 16:00:42.035025
- Title: A pragmatic policy learning approach to account for users' fatigue in repeated auctions
- Title(参考訳): 繰り返しオークションにおける利用者の疲労を考慮した実用的政策学習手法
- Authors: Benjamin Heymann, Rémi Chan--Renous-Legoubin, Alexandre Gilotte,
- Abstract要約: MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。
この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。
我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
- 参考スコア(独自算出の注目度): 47.75983850930121
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online advertising banners are sold in real-time through auctions.Typically, the more banners a user is shown, the smaller the marginalvalue of the next banner for this user is. This fact can be detected bybasic ML models, that can be used to predict how previously won auctionsdecrease the current opportunity value. However, learning is not enough toproduce a bid that correctly accounts for how winning the current auctionimpacts the future values. Indeed, a policy that uses this prediction tomaximize the expected payoff of the current auction could be dubbedimpatient because such policy does not fully account for the repeatednature of the auctions. Under this perspective, it seems that most biddersin the literature are impatient. Unsurprisingly, impatience induces a cost.We provide two empirical arguments for the importance of this cost ofimpatience. First, an offline counterfactual analysis and, second, a notablebusiness metrics improvement by mitigating the cost of impatience withpolicy learning
- Abstract(参考訳): オンライン広告バナーはオークションを通じてリアルタイムに販売され、ユーザーが表示するバナーが増えるほど、次のバナーのマージン値が小さくなる。
この事実はベーシックなMLモデルによって検出することができ、これは前回の競売が現在の機会価値を減らしたことを予測するために使用することができる。
しかし、現在の競売に勝つことが将来の価値にどのように影響するかを正しく説明する入札を生み出すには、学習が十分ではない。
実際、この予測を用いて現在の競売の予想利益を最大化する政策は、競売の繰り返しを十分に考慮していないため、不注意と称されることがある。
この見地からすると、ほとんどの文献の入札者は不便なようだ。
当然のことながら、不服従はコストを生じさせ、我々はこのコスト不服従の重要性を実証的に2つの議論する。
第一に、オフラインの対実分析、第二に、政治的学習に対する不忍のコストを軽減し、注目すべきビジネス指標の改善
関連論文リスト
- Randomized Truthful Auctions with Learning Agents [10.39657928150242]
本研究では, エージェントが未学習の学習を用いて, 繰り返しオークションに参加する環境について検討する。
競売者が非回帰入札アルゴリズムを用いて第2価格の競売に参加する場合、勝者が真に競売に収束しないことが示される。
我々は,第2代競売の収益と競売との収益を比べて,エムオークションのコンセプトを定義した。
論文 参考訳(メタデータ) (2024-11-14T15:28:40Z) - Improved Online Learning Algorithms for CTR Prediction in Ad Auctions [8.2536631346421]
広告オークションにおける収益のオンライン学習問題について検討する。
広告主の戦略的行動の2つのモデルに焦点を当てる。
我々は,高信頼度境界に基づくオンラインメカニズムを開発し,O(sqrtT)$後悔の度合いを実現する。
論文 参考訳(メタデータ) (2024-02-29T14:10:26Z) - Leveraging the Hints: Adaptive Bidding in Repeated First-Price Auctions [42.002983450368134]
プライスオークションでの競売の仕方について検討する。
第二価格のオークションとは異なり、個人価値を真に入札することはもはや最適ではない。
1つは1つの点予測が可能であり、もう1つはヒント間隔が利用可能である。
論文 参考訳(メタデータ) (2022-11-05T19:20:53Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Fast Rate Learning in Stochastic First Price Bidding [0.0]
ファーストプライスのオークションは、プログラム広告におけるビックレーのオークションに基づく伝統的な入札アプローチを大きく置き換えている。
対戦相手の最大入札分布が分かっている場合, 後悔度を著しく低くする方法を示す。
我々のアルゴリズムは、様々な入札分布の文献で提案されている選択肢よりもはるかに高速に収束する。
論文 参考訳(メタデータ) (2021-07-05T07:48:52Z) - A novel auction system for selecting advertisements in Real-Time bidding [68.8204255655161]
リアルタイム入札(Real-Time Bidding)は、インターネット広告システムで、近年非常に人気を集めている。
本稿では、経済的な側面だけでなく、広告システムの機能にかかわる他の要因も考慮した、新たなアプローチによる代替ベッティングシステムを提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:41Z) - ProportionNet: Balancing Fairness and Revenue for Auction Design with
Deep Learning [55.76903822619047]
本研究では,強力なインセンティブ保証を備えた収益最大化オークションの設計について検討する。
我々は、高い収益と強力なインセンティブ保証を維持しつつ、公平性の懸念に対処するため、深層学習を用いてオークションを近似する手法を拡張した。
論文 参考訳(メタデータ) (2020-10-13T13:54:21Z) - Learning to Infer User Hidden States for Online Sequential Advertising [52.169666997331724]
本稿では,これらの問題に対処するディープインテントシーケンス広告(DISA)手法を提案する。
解釈可能性の鍵となる部分は、消費者の購入意図を理解することである。
論文 参考訳(メタデータ) (2020-09-03T05:12:26Z) - Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions [13.234975857626752]
我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。
このような戦略的行動に頑健な学習方針を提案する。
論文 参考訳(メタデータ) (2020-02-25T19:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。