論文の概要: Approximating Auction Equilibria with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2410.13960v1
- Date: Thu, 17 Oct 2024 18:34:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:13.762262
- Title: Approximating Auction Equilibria with Reinforcement Learning
- Title(参考訳): 強化学習によるオークション均衡の近似
- Authors: Pranjal Rawat,
- Abstract要約: 本稿では,ベイズ・ナッシュ均衡を近似する高度なアルゴリズムを用いた自己学習型強化学習手法を提案する。
自己プレイを通じて、これらのアルゴリズムは、既知の平衡を持つオークションにおいて、堅牢でほぼ最適な入札戦略を学習することができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Traditional methods for computing equilibria in auctions become computationally intractable as auction complexity increases, particularly in multi-item and dynamic auctions. This paper introduces a self-play based reinforcement learning approach that employs advanced algorithms such as Proximal Policy Optimization and Neural Fictitious Self-Play to approximate Bayes-Nash equilibria. This framework allows for continuous action spaces, high-dimensional information states, and delayed payoffs. Through self-play, these algorithms can learn robust and near-optimal bidding strategies in auctions with known equilibria, including those with symmetric and asymmetric valuations, private and interdependent values, and multi-round auctions.
- Abstract(参考訳): 競売における平衡計算の伝統的な方法は、競売の複雑さが増大するにつれて、特にマルチイテムや動的競売において、計算的に難解になる。
本稿では,ベイズ・ナッシュ均衡を近似するために,近似ポリシー最適化やニューラル・フィクティトゥ・セルフプレイといった高度なアルゴリズムを用いた自己遊び型強化学習手法を提案する。
このフレームワークは、連続的なアクション空間、高次元情報状態、遅延ペイオフを可能にする。
自己プレイを通じて、これらのアルゴリズムは、対称的および非対称な評価、私的および相互依存的な値、多ラウンドオークションを含む、既知の平衡を持つオークションにおいて、堅牢でほぼ最適入札戦略を学ぶことができる。
関連論文リスト
- Procurement Auctions via Approximately Optimal Submodular Optimization [53.93943270902349]
競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文 参考訳(メタデータ) (2024-11-20T18:06:55Z) - Deep Reinforcement Learning for Sequential Combinatorial Auctions [40.89021064082742]
収益-最適オークションデザインは、重要な理論的および実践的な意味を持つ難しい問題である。
本稿では,一階勾配を利用した逐次オークションに適した新しい強化学習フレームワークを提案する。
提案手法は,分析ベースラインと標準強化学習アルゴリズムの両方に対して,収益の大幅な向上を実現する。
論文 参考訳(メタデータ) (2024-07-10T20:00:22Z) - Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.57122943187086]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。
ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。
提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文 参考訳(メタデータ) (2024-07-02T03:31:21Z) - Understanding Iterative Combinatorial Auction Designs via Multi-Agent Reinforcement Learning [10.41350502488723]
我々は,反復オークションを理解するためにマルチエージェント強化学習アルゴリズムを利用できるか検討する。
MARLは本当にオークション分析の恩恵を受けることができるが、効果的にデプロイすることは簡単ではない。
クロックオークションにおける特定のルール変更を評価するために,提案手法を用いた提案手法の有効性について述べる。
論文 参考訳(メタデータ) (2024-02-29T18:16:13Z) - Learning in Repeated Multi-Unit Pay-As-Bid Auctions [3.6294895527930504]
本研究では,単一入札者の視点から,ペイ・アズ・バイド(PAB)オークションにおける入札戦略の問題点を考察する。
提案手法は,競合する入札が事前に知られている場合のオフライン問題を,時間アルゴリズムで解くことができることを示す。
また,PAB平衡のキャラクタリゼーションについても検討した。
論文 参考訳(メタデータ) (2023-07-27T20:49:28Z) - Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.62091043347035]
オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T21:59:30Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - A Context-Integrated Transformer-Based Neural Network for Auction Design [25.763612577196124]
オークションデザインにおける中心的な問題の1つは、競売人の予想収益を最大化するインセンティブに適合するメカニズムを開発することである。
最適なオークション設計のためのコンテクスト積分変換器ベースニューラルネットワークである$mathtCITransNet$を提案する。
我々は、$mathttCITransNet$が、シングルイット設定で既知の最適解を回復し、マルチイットオークションで強いベースラインを上回り、トレーニング中以外のケースによく当てはまることを示す。
論文 参考訳(メタデータ) (2022-01-29T03:47:00Z) - Anti-Concentrated Confidence Bonuses for Scalable Exploration [57.91943847134011]
固有の報酬は、探検と探検のトレードオフを扱う上で中心的な役割を果たす。
楕円ボーナスを効率的に近似するためのエンファンティ集中型信頼境界を導入する。
我々は,Atariベンチマーク上での現代固有の報酬と競合する,深層強化学習のための実用的な変種を開発する。
論文 参考訳(メタデータ) (2021-10-21T15:25:15Z) - ProportionNet: Balancing Fairness and Revenue for Auction Design with
Deep Learning [55.76903822619047]
本研究では,強力なインセンティブ保証を備えた収益最大化オークションの設計について検討する。
我々は、高い収益と強力なインセンティブ保証を維持しつつ、公平性の懸念に対処するため、深層学習を用いてオークションを近似する手法を拡張した。
論文 参考訳(メタデータ) (2020-10-13T13:54:21Z) - Bid Prediction in Repeated Auctions with Learning [30.07778295477907]
本稿では,メインストリームの検索オークションマーケットプレースからのデータセットを用いて,繰り返しオークションにおける入札予測の問題を検討する。
提案手法は,非regret型エコノメトリを用いて入札予測を行い,ユーティリティ関数に関する非regret学習者としてプレーヤをモデル化する。
この手法は,最先端の時系列機械学習手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2020-07-26T18:14:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。