論文の概要: The Bidding Games: Reinforcement Learning for MEV Extraction on Polygon Blockchain
- arxiv url: http://arxiv.org/abs/2510.14642v1
- Date: Thu, 16 Oct 2025 12:54:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.86156
- Title: The Bidding Games: Reinforcement Learning for MEV Extraction on Polygon Blockchain
- Title(参考訳): 入札ゲーム:ポリゴンブロックチェーン上でのMEV抽出のための強化学習
- Authors: Andrei Seoev, Leonid Gremyachikh, Anastasiia Smirnova, Yash Madhwal, Alisa Kalacheva, Dmitry Belousov, Ilia Zubov, Aleksei Smirnov, Denis Fedyanin, Vladimir Gorgadze, Yury Yanovich,
- Abstract要約: 本稿では,ポリゴンアトラスを用いたMEV抽出のための強化学習フレームワークを提案する。
我々の研究は、高頻度MEV環境において強化学習が重要な利点をもたらすことを証明している。
- 参考スコア(独自算出の注目度): 0.11880231424287215
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In blockchain networks, the strategic ordering of transactions within blocks has emerged as a significant source of profit extraction, known as Maximal Extractable Value (MEV). The transition from spam-based Priority Gas Auctions to structured auction mechanisms like Polygon Atlas has transformed MEV extraction from public bidding wars into sealed-bid competitions under extreme time constraints. While this shift reduces network congestion, it introduces complex strategic challenges where searchers must make optimal bidding decisions within a sub-second window without knowledge of competitor behavior or presence. Traditional game-theoretic approaches struggle in this high-frequency, partially observable environment due to their reliance on complete information and static equilibrium assumptions. We present a reinforcement learning framework for MEV extraction on Polygon Atlas and make three contributions: (1) A novel simulation environment that accurately models the stochastic arrival of arbitrage opportunities and probabilistic competition in Atlas auctions; (2) A PPO-based bidding agent optimized for real-time constraints, capable of adaptive strategy formulation in continuous action spaces while maintaining production-ready inference speeds; (3) Empirical validation demonstrating our history-conditioned agent captures 49\% of available profits when deployed alongside existing searchers and 81\% when replacing the market leader, significantly outperforming static bidding strategies. Our work establishes that reinforcement learning provides a critical advantage in high-frequency MEV environments where traditional optimization methods fail, offering immediate value for industrial participants and protocol designers alike.
- Abstract(参考訳): ブロックチェーンネットワークでは、ブロック内のトランザクションの戦略的順序付けが、最大抽出可能な価値(MEV)として知られる重要な利益抽出源として現れている。
スパムベースのプライオリティガスオークションから、Polygon Atlasのような構造化オークションメカニズムへの移行は、MEVの公開入札戦争からの抽出を、極端な時間的制約の下で封印された入札競争に転換した。
このシフトはネットワークの混雑を減少させるが、検索者は競合する行動や存在を知ることなく、秒以下のウィンドウ内で最適な入札決定をしなければならない複雑な戦略上の課題をもたらす。
伝統的なゲーム理論のアプローチは、完全な情報と静的平衡仮定に依存しているため、この高周波で部分的に観測可能な環境に苦しむ。
我々は,ポリゴンアトラス上でのMEV抽出のための強化学習の枠組みを提案し,(1)アトラスオークションにおける仲裁機会の確率的到着と確率的競争を正確にモデル化する新しいシミュレーション環境,(2)実時間制約に最適化されたPPOベースの入札エージェント,(3)生産レベルの推論速度を維持しながら連続的な行動空間における適応的戦略定式化が可能なPPOベースの入札エージェント,(3)既存サーチと並行して展開する際の履歴条件付きエージェントの可利用利益の49%,および市場リーダーに代えて81パーセントを達成し,静的入札戦略を著しく向上する実験的検証を行う。
我々の研究は、従来の最適化手法が失敗する高周波MEV環境において、強化学習が重要な利点となり、産業参加者やプロトコルデザイナにも即座に価値をもたらすことを実証している。
関連論文リスト
- Trade in Minutes! Rationality-Driven Agentic System for Quantitative Financial Trading [57.28635022507172]
TiMiは、アーキテクチャ上、戦略開発を分単位のデプロイメントから切り離す合理性駆動型マルチエージェントシステムである。
本稿では,マクロパターンからマイクロカスタマイズ,トレーディングボット実装のための階層型プログラミング設計,数学的リフレクションによって駆動されるクローズドループ最適化までの2層解析パラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-06T13:08:55Z) - Agentic Reinforcement Learning with Implicit Step Rewards [92.26560379363492]
大規模言語モデル (LLMs) は強化学習 (agentic RL) を用いた自律的エージェントとして発展している。
我々は,標準RLアルゴリズムとシームレスに統合された一般的なクレジット割り当て戦略であるエージェントRL(iStar)について,暗黙的なステップ報酬を導入する。
我々は,WebShopとVisualSokobanを含む3つのエージェントベンチマークと,SOTOPIAにおける検証不可能な報酬とのオープンなソーシャルインタラクションについて評価した。
論文 参考訳(メタデータ) (2025-09-23T16:15:42Z) - Incentive-Aware Dynamic Resource Allocation under Long-Term Cost Constraints [24.842944692980495]
本研究では,再利用可能な資源の戦略的エージェントへの動的割り当てについて検討する。
戦略行動に頑健な原始二重手法を実現するインセンティブ対応フレームワークを開発した。
論文 参考訳(メタデータ) (2025-07-13T03:18:02Z) - Dynamic Reinsurance Treaty Bidding via Multi-Agent Reinforcement Learning [0.0]
本稿では,再保証条約入札のための新しいマルチエージェント強化学習(MARL)フレームワークを開発する。
MARLエージェントは、最大15%高い引受利益、20%低い尾リスク、25%以上のシャープ比の改善を達成する。
これらの結果は、MARLがより透明性があり、適応的で、リスクに敏感なリシュアランス市場への道を開くことを示唆している。
論文 参考訳(メタデータ) (2025-06-16T05:43:22Z) - Deep Reinforcement Learning-Based Bidding Strategies for Prosumers Trading in Double Auction-Based Transactive Energy Market [10.071307102216371]
コミュニティベースのダブルオークション市場は、消費者が社会福祉への参加と最大化を奨励する有望なTEMと見なされている。
本研究では,複数のDERを具備したTEMを用いて,エネルギー取引を透過的かつ効率的に管理する方式を提案する。
また、市場環境のスケーラビリティとプライバシを確保するために、分散学習と実行を伴う深層強化学習(DRL)モデルを提案する。
論文 参考訳(メタデータ) (2025-02-16T21:38:21Z) - Learning to Bid in Non-Stationary Repeated First-Price Auctions [27.743710782882136]
第一価オークションはデジタル広告市場で大きな注目を集めている。
第一価格オークションにおける最適な入札戦略を決定することはより複雑である。
対戦者の最多入札の順序のクラスに対する動的後悔の最小最大最適評価法を提案する。
論文 参考訳(メタデータ) (2025-01-23T03:53:27Z) - Mimicking Better by Matching the Approximate Action Distribution [48.95048003354255]
そこで我々は,Imitation Learning from Observationsのための新しい,サンプル効率の高いオンライン政治アルゴリズムMAADを紹介する。
我々は、専門家のパフォーマンスを達成するためには、かなり少ないインタラクションが必要であり、現在最先端の政治手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T12:43:47Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。