論文の概要: HGFormer: A Hierarchical Graph Transformer Framework for Two-Stage Colonel Blotto Games via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2506.08580v1
- Date: Tue, 10 Jun 2025 08:51:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:42.051601
- Title: HGFormer: A Hierarchical Graph Transformer Framework for Two-Stage Colonel Blotto Games via Reinforcement Learning
- Title(参考訳): HGFormer:強化学習による2段階のBlottoゲームのための階層型グラフトランスフォーマフレームワーク
- Authors: Yang Lv, Jinlong Lei, Peng Yi,
- Abstract要約: ブロット大佐の2段階のゲームは典型的な逆資源割り当て問題を表す。
本稿ではHGformerと呼ばれる階層型グラフトランスフォーマフレームワークを提案する。
本手法により,大規模環境における効率的な政策生成が可能となる。
- 参考スコア(独自算出の注目度): 4.144893164317513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Two-stage Colonel Blotto game represents a typical adversarial resource allocation problem, in which two opposing agents sequentially allocate resources in a network topology across two phases: an initial resource deployment followed by multiple rounds of dynamic reallocation adjustments. The sequential dependency between game stages and the complex constraints imposed by the graph topology make it difficult for traditional approaches to attain a globally optimal strategy. To address these challenges, we propose a hierarchical graph Transformer framework called HGformer. By incorporating an enhanced graph Transformer encoder with structural biases and a two-agent hierarchical decision model, our approach enables efficient policy generation in large-scale adversarial environments. Moreover, we design a layer-by-layer feedback reinforcement learning algorithm that feeds the long-term returns from lower-level decisions back into the optimization of the higher-level strategy, thus bridging the coordination gap between the two decision-making stages. Experimental results demonstrate that, compared to existing hierarchical decision-making or graph neural network methods, HGformer significantly improves resource allocation efficiency and adversarial payoff, achieving superior overall performance in complex dynamic game scenarios.
- Abstract(参考訳): ブロット大佐の2段階のゲームは典型的な逆資源配分問題であり、2つのエージェントがネットワークトポロジーにおけるリソースを逐次割り当てる。
ゲームステージとグラフトポロジーによって課される複雑な制約の間の逐次的依存は、従来のアプローチがグローバルに最適な戦略を達成するのを困難にしている。
これらの課題に対処するため,HGformerと呼ばれる階層型グラフトランスフォーマフレームワークを提案する。
構造バイアスを伴う拡張グラフトランスフォーマーエンコーダと2エージェント階層決定モデルを組み合わせることにより,大規模環境下での効率的なポリシ生成を実現する。
さらに,階層単位のフィードバック強化学習アルゴリズムを設計し,低レベルの意思決定からの長期的なフィードバックを高レベルの戦略の最適化にフィードバックし,両者の意思決定段階間の協調ギャップを埋める。
実験結果から,HGformerは,既存の階層的決定法やグラフニューラルネットワーク手法と比較して資源配分効率と対向的なペイオフを大幅に改善し,複雑なダイナミックゲームシナリオにおける全体的な性能を向上することを示した。
関連論文リスト
- SHIELD: Multi-task Multi-distribution Vehicle Routing Solver with Sparsity and Hierarchy [24.465543841726355]
疎性と階層性の両方の原則を活用する新しいモデルであるShielDを紹介する。
より優れた局所表現を生成するために,問題における階層構造の存在を活かしたコンテキストベースのクラスタリング層を開発する。
提案手法は, 実世界の9つの地図において, 16種類のVRPのバリエーションを持つ既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-06-10T03:55:14Z) - CR-BLEA: Contrastive Ranking for Adaptive Resource Allocation in Bilevel Evolutionary Algorithms [9.411648722302711]
双レベル最適化は、ネスト構造のため、重要な計算上の課題となる。
本稿では,二段階進化アルゴリズムのための新しい資源配分フレームワークを提案する。
我々のフレームワークは、解の正確性を維持しながら、計算コストを大幅に削減します。
論文 参考訳(メタデータ) (2025-06-03T17:31:49Z) - An Efficient Dynamic Resource Allocation Framework for Evolutionary Bilevel Optimization [14.51523276196879]
両レベル最適化問題は、上層階が、下層階の応答を同時に考慮しながら、その戦略を最適化しようとする対話的階層構造によって特徴づけられる。
本稿では、進化的二段階最適化のための効率的な動的リソース割り当てフレームワーク DRC-BLEA を提案する。
論文 参考訳(メタデータ) (2024-10-31T16:17:11Z) - Pre-trained Graphformer-based Ranking at Web-scale Search (Extended Abstract) [56.55728466130238]
本稿では,変換器の回帰能力をGNNのリンク予測強度と統合することを目的とした新しいMPGrafモデルを提案する。
我々は、MPGrafの性能を厳格に評価するために、大規模なオフラインおよびオンライン実験を行っている。
論文 参考訳(メタデータ) (2024-09-25T03:33:47Z) - T-GAE: Transferable Graph Autoencoder for Network Alignment [79.89704126746204]
T-GAEはグラフオートエンコーダフレームワークで、GNNの転送性と安定性を活用して、再トレーニングなしに効率的なネットワークアライメントを実現する。
実験の結果、T-GAEは最先端の最適化手法と最高のGNN手法を最大38.7%、50.8%で上回っていることがわかった。
論文 参考訳(メタデータ) (2023-10-05T02:58:29Z) - WLD-Reg: A Data-dependent Within-layer Diversity Regularizer [98.78384185493624]
ニューラルネットワークは、勾配に基づく最適化と共同で訓練された階層構造に配置された複数の層で構成されている。
我々は、この従来の「中間層」フィードバックを補うために、同じ層内での活性化の多様性を促進するために、追加の「中間層」フィードバックを補うことを提案する。
本稿では,提案手法が複数のタスクにおける最先端ニューラルネットワークモデルの性能を向上させることを実証した広範な実証研究を提案する。
論文 参考訳(メタデータ) (2023-01-03T20:57:22Z) - Multilevel-in-Layer Training for Deep Neural Network Regression [1.6185544531149159]
ニューラルネットワークの階層構造を構築し,訓練する多段階正規化戦略を提案する。
我々はPDE回帰問題を用いて,本手法が効果的な正則化手法であることを示す。
論文 参考訳(メタデータ) (2022-11-11T23:53:46Z) - Dynamic Hierarchical Mimicking Towards Consistent Optimization
Objectives [73.15276998621582]
一般化能力を高めたCNN訓練を推進するための汎用的特徴学習機構を提案する。
DSNに部分的にインスパイアされた私たちは、ニューラルネットワークの中間層から微妙に設計されたサイドブランチをフォークしました。
カテゴリ認識タスクとインスタンス認識タスクの両方の実験により,提案手法の大幅な改善が示された。
論文 参考訳(メタデータ) (2020-03-24T09:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。