論文の概要: Randomized Truthful Auctions with Learning Agents
- arxiv url: http://arxiv.org/abs/2411.09517v1
- Date: Thu, 14 Nov 2024 15:28:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 15:23:20.141278
- Title: Randomized Truthful Auctions with Learning Agents
- Title(参考訳): 学習エージェントによるランダム化真理オークション
- Authors: Gagan Aggarwal, Anupam Gupta, Andres Perlroth, Grigoris Velegkas,
- Abstract要約: 本研究では, エージェントが未学習の学習を用いて, 繰り返しオークションに参加する環境について検討する。
競売者が非回帰入札アルゴリズムを用いて第2価格の競売に参加する場合、勝者が真に競売に収束しないことが示される。
我々は,第2代競売の収益と競売との収益を比べて,エムオークションのコンセプトを定義した。
- 参考スコア(独自算出の注目度): 10.39657928150242
- License:
- Abstract: We study a setting where agents use no-regret learning algorithms to participate in repeated auctions. \citet{kolumbus2022auctions} showed, rather surprisingly, that when bidders participate in second-price auctions using no-regret bidding algorithms, no matter how large the number of interactions $T$ is, the runner-up bidder may not converge to bidding truthfully. Our first result shows that this holds for \emph{general deterministic} truthful auctions. We also show that the ratio of the learning rates of the bidders can \emph{qualitatively} affect the convergence of the bidders. Next, we consider the problem of revenue maximization in this environment. In the setting with fully rational bidders, \citet{myerson1981optimal} showed that revenue can be maximized by using a second-price auction with reserves.We show that, in stark contrast, in our setting with learning bidders, \emph{randomized} auctions can have strictly better revenue guarantees than second-price auctions with reserves, when $T$ is large enough. Finally, we study revenue maximization in the non-asymptotic regime. We define a notion of {\em auctioneer regret} comparing the revenue generated to the revenue of a second price auction with truthful bids. When the auctioneer has to use the same auction throughout the interaction, we show an (almost) tight regret bound of $\smash{\widetilde \Theta(T^{3/4})}.$ If the auctioneer can change auctions during the interaction, but in a way that is oblivious to the bids, we show an (almost) tight bound of $\smash{\widetilde \Theta(\sqrt{T})}.$
- Abstract(参考訳): 本研究では,エージェントが未学習の学習アルゴリズムを用いて,繰り返しオークションに参加する環境について検討する。
\citet{kolumbus2022auctions} は、意外なことに、入札者がno-regretの入札アルゴリズムを使用して第2価格のオークションに参加するとき、T$がいくらあるとしても、勝者が真に入札に収束しないことを示した。
我々の最初の結果は、これが真に決定的な真偽のオークションに当てはまることを示している。
また,入札者の学習率の比率が入札者の収束に影響を及ぼすことを示す。
次に,この環境における収益最大化の問題について考察する。
完全に合理的な入札者によるセッティングにおいて,「Mecitet{myerson 1981optimal}」は,リザーブ付き第2価格オークションを用いて収益を最大化できることを示し,対照的に,学習入札者によるセッティングにおいて,「emph{randomized}オークション」は,リザーブ付き第2価格オークションよりも厳格に優れた収益保証が得られることを示した。
最後に,非漸近的体制における収益の最大化について検討する。
我々は、第2の価格オークションの収益と真偽の入札の収益とを比較した「オークションの後悔」という概念を定義した。
競売人が相互作用を通して同じオークションを使わなければならないとき、(ほとんど)厳密な後悔の束として$\smash{\widetilde \Theta(T^{3/4})} を示す。
auctioneer がインタラクション中にオークションを変更することができるならば、入札に不利な方法では、$\smash{\widetilde \Theta(\sqrt{T})} の(ほとんど)厳密な境界を示す。
$
関連論文リスト
- A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.75983850930121]
MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。
この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。
我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文 参考訳(メタデータ) (2024-07-15T07:53:29Z) - Learning in Repeated Multi-Unit Pay-As-Bid Auctions [3.6294895527930504]
本研究では,単一入札者の視点から,ペイ・アズ・バイド(PAB)オークションにおける入札戦略の問題点を考察する。
提案手法は,競合する入札が事前に知られている場合のオフライン問題を,時間アルゴリズムで解くことができることを示す。
また,PAB平衡のキャラクタリゼーションについても検討した。
論文 参考訳(メタデータ) (2023-07-27T20:49:28Z) - Learning and Collusion in Multi-unit Auctions [17.727436775513368]
均一な価格で複数ユニットのオークションを繰り返し検討する。
このオークションの特性をオフラインとオンラインの両方で分析する。
ここでは、$(K+1)$-stの価格形式が入札者間の共謀の影響を受けやすいことを示す。
論文 参考訳(メタデータ) (2023-05-27T08:00:49Z) - Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.62091043347035]
オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T21:59:30Z) - Leveraging the Hints: Adaptive Bidding in Repeated First-Price Auctions [42.002983450368134]
プライスオークションでの競売の仕方について検討する。
第二価格のオークションとは異なり、個人価値を真に入札することはもはや最適ではない。
1つは1つの点予測が可能であり、もう1つはヒント間隔が利用可能である。
論文 参考訳(メタデータ) (2022-11-05T19:20:53Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Artificial Intelligence and Auction Design [0.0]
付加的なフィードバックを伴わないファーストプライスのオークションが,暗黙的な結果につながることが判明した。
この違いは, 単価の競売において, 競争相手を1つの入札インクリメントで圧倒するインセンティブによって引き起こされることを示す。
また、Googleが第1価格のオークションに切り替えたときに導入した最低入札に関する情報が、オークションの競争力を高めることも示している。
論文 参考訳(メタデータ) (2022-02-12T00:54:40Z) - Fast Rate Learning in Stochastic First Price Bidding [0.0]
ファーストプライスのオークションは、プログラム広告におけるビックレーのオークションに基づく伝統的な入札アプローチを大きく置き換えている。
対戦相手の最大入札分布が分かっている場合, 後悔度を著しく低くする方法を示す。
我々のアルゴリズムは、様々な入札分布の文献で提案されている選択肢よりもはるかに高速に収束する。
論文 参考訳(メタデータ) (2021-07-05T07:48:52Z) - ProportionNet: Balancing Fairness and Revenue for Auction Design with
Deep Learning [55.76903822619047]
本研究では,強力なインセンティブ保証を備えた収益最大化オークションの設計について検討する。
我々は、高い収益と強力なインセンティブ保証を維持しつつ、公平性の懸念に対処するため、深層学習を用いてオークションを近似する手法を拡張した。
論文 参考訳(メタデータ) (2020-10-13T13:54:21Z) - Optimal No-regret Learning in Repeated First-price Auctions [38.908235632001116]
オンライン学習を反復した初価オークションで研究する。
我々は,ほぼ最適の$widetildeO(sqrtT)$ regret boundを達成するための最初の学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-03-22T03:32:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。