論文の概要: A Game-Theoretic Spatio-Temporal Reinforcement Learning Framework for Collaborative Public Resource Allocation
- arxiv url: http://arxiv.org/abs/2510.26184v1
- Date: Thu, 30 Oct 2025 06:43:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.687026
- Title: A Game-Theoretic Spatio-Temporal Reinforcement Learning Framework for Collaborative Public Resource Allocation
- Title(参考訳): 協調的公共資源配分のためのゲーム理論時空間強化学習フレームワーク
- Authors: Songxin Lei, Qiongyan Wang, Yanchen Zhu, Hanyu Yao, Sijie Ruan, Weilin Ruan, Yuyu Luo, Huaming Wu, Yuxuan Liang,
- Abstract要約: 個人資源の移動を最適化するための,新しい,より実践的なアプローチを提案する。
1) CPRA問題をポテンシャルゲームとして定式化し、ポテンシャル関数と最適目標の間にギャップがないことを証明し、このNP-ハード問題のナッシュ平衡を近似するためのしっかりとした理論的基礎を築いた。
- 参考スコア(独自算出の注目度): 38.37718319753764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Public resource allocation involves the efficient distribution of resources, including urban infrastructure, energy, and transportation, to effectively meet societal demands. However, existing methods focus on optimizing the movement of individual resources independently, without considering their capacity constraints. To address this limitation, we propose a novel and more practical problem: Collaborative Public Resource Allocation (CPRA), which explicitly incorporates capacity constraints and spatio-temporal dynamics in real-world scenarios. We propose a new framework called Game-Theoretic Spatio-Temporal Reinforcement Learning (GSTRL) for solving CPRA. Our contributions are twofold: 1) We formulate the CPRA problem as a potential game and demonstrate that there is no gap between the potential function and the optimal target, laying a solid theoretical foundation for approximating the Nash equilibrium of this NP-hard problem; and 2) Our designed GSTRL framework effectively captures the spatio-temporal dynamics of the overall system. We evaluate GSTRL on two real-world datasets, where experiments show its superior performance. Our source codes are available in the supplementary materials.
- Abstract(参考訳): 公共資源配分は、社会的要求を効果的に満たすために、都市インフラ、エネルギー、交通などの資源の効率的な分配を含む。
しかし, 既存の手法では, 容量制約を考慮せずに, 個別資源の移動を個別に最適化することに集中している。
この制限に対処するために,我々は, 実世界のシナリオにおいて, 容量制約と時空間ダイナミクスを明示的に組み込んだ協調的公共資源割当(CPRA)を提案する。
CPRAを解くためのGSTRL(Game-Theoretic Spatio-Temporal Reinforcement Learning)と呼ばれる新しいフレームワークを提案する。
私たちの貢献は2つあります。
1) CPRA問題をポテンシャルゲームとして定式化し、ポテンシャル関数と最適目標の間にギャップがないことを証明し、このNPハード問題のナッシュ平衡を近似するためのしっかりとした理論的基礎を築いた。
2) 設計したGSTRLフレームワークはシステム全体の時空間的ダイナミクスを効果的に捉える。
GSTRLを実世界の2つのデータセットで評価し、実験により優れた性能を示す。
ソースコードは補足資料で利用可能です。
関連論文リスト
- RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization [111.1749164063616]
大規模言語モデル(LLM)のための新しいハイブリッド政治最適化手法RL-PLUSを提案する。
RL-PLUSは、外部データと内部エクスプロイトを相乗化して、より強力な推論能力を達成し、ベースモデルのバウンダリを超える。
提案手法の優位性と一般化性を示すため,理論解析と広範な実験を行った。
論文 参考訳(メタデータ) (2025-07-31T23:55:29Z) - Situational-Constrained Sequential Resources Allocation via Reinforcement Learning [17.8234166913582]
状況制約を伴う逐次資源配分は、現実世界のアプリケーションにおいて大きな課題となる。
本稿では,この問題に対処するための新しいフレームワークであるSCRLを紹介する。
我々は制約違反を動的に罰する新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-06-17T02:40:49Z) - Dynamic Matching with Post-allocation Service and its Application to Refugee Resettlement [1.9689888982532262]
米国の主要難民再定住機関との協力により、我々は、新しい到着(難民事件)が静的リソースの1つと即時かつ不可逆的に一致しなければならない動的なマッチング問題について研究した。
学習に基づくアルゴリズムは、特定の状況下で逆向きに最適であり、容易に解釈でき、計算的に高速である。
論文 参考訳(メタデータ) (2024-10-30T13:17:38Z) - Reinforcement Learning under Latent Dynamics: Toward Statistical and Algorithmic Modularity [51.40558987254471]
強化学習の現実的な応用は、エージェントが複雑な高次元の観察を行う環境を含むことが多い。
本稿では,統計的・アルゴリズム的な観点から,textit General$ latent dynamicsの下での強化学習の課題に対処する。
論文 参考訳(メタデータ) (2024-10-23T14:22:49Z) - Frugal inference for control [2.20480252274709]
人工知能の進歩の鍵となる課題は、外部の動きとリソース利用の適切なバランスを達成することである。
我々は,POMDPフレームワークのバージョンを開発し,推論によって得られた情報を,タスクのパフォーマンスや動作の労力とともに最適化する必要があるリソースとして扱う。
この研究は、脳と機械の両方が不確実性の下で効果的だが資源効率のよい制御に使用できる新しいタイプの有理計算の基礎を提供する。
論文 参考訳(メタデータ) (2024-06-20T15:50:38Z) - Towards Deployment-Efficient Reinforcement Learning: Lower Bound and
Optimality [141.89413461337324]
展開効率は、強化学習(RL)の多くの実世界の応用にとって重要な基準である
本稿では,「制約付き最適化」の観点から,デプロイ効率の高いRL(DE-RL)の理論的定式化を提案する。
論文 参考訳(メタデータ) (2022-02-14T01:31:46Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Deep Learning-based Resource Allocation for Infrastructure Resilience [0.5249805590164901]
意思決定者は、トレーニングされたモデルを使用して、緊急時にリソースをより効率的に割り当てることができます。
本稿では,TNのシェルビー郡における実世界の相互依存インフラによる方法論について紹介する。
論文 参考訳(メタデータ) (2020-07-12T00:48:15Z) - Decentralized Reinforcement Learning: Global Decision-Making via Local
Economic Transactions [80.49176924360499]
我々は、シーケンシャルな意思決定問題を解決するために、単純で専門的で自己関心のあるエージェントの社会を指示する枠組みを確立する。
我々は分散強化学習アルゴリズムのクラスを導出する。
我々は、より効率的な移動学習のための社会固有のモジュラー構造の潜在的な利点を実証する。
論文 参考訳(メタデータ) (2020-07-05T16:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。