論文の概要: Scaling up Stability: Reinforcement Learning for Distributed Control of Networked Systems in the Space of Stabilizing Policies
- arxiv url: http://arxiv.org/abs/2512.18540v1
- Date: Sat, 20 Dec 2025 23:35:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.388548
- Title: Scaling up Stability: Reinforcement Learning for Distributed Control of Networked Systems in the Space of Stabilizing Policies
- Title(参考訳): 安定性のスケールアップ:安定化政策空間におけるネットワークシステムの分散制御のための強化学習
- Authors: John Cao, Luca Furieri,
- Abstract要約: 本稿では,グラフニューラルネットワーク(GNN)をユーラ様の等級方向パラメータ化に組み込むポリシパラメータ化を提案する。
この大きさは、乱れフィードバックに作用するGNNと、局所的な観測に作用するGNNからなる安定作用素として実装される。
実験により、小さなネットワークで訓練されたポリシーは、より大きなネットワークと見えないネットワークトポロジに直接転送し、最先端のMARLベースラインよりも高いリターンと低い分散を達成することが示された。
- 参考スコア(独自算出の注目度): 0.49109372384514843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study distributed control of networked systems through reinforcement learning, where neural policies must be simultaneously scalable, expressive and stabilizing. We introduce a policy parameterization that embeds Graph Neural Networks (GNNs) into a Youla-like magnitude-direction parameterization, yielding distributed stochastic controllers that guarantee network-level closed-loop stability by design. The magnitude is implemented as a stable operator consisting of a GNN acting on disturbance feedback, while the direction is a GNN acting on local observations. We prove robustness of the closed loop to perturbations in both the graph topology and model parameters, and show how to integrate our parameterization with Proximal Policy Optimization. Experiments on a multi-agent navigation task show that policies trained on small networks transfer directly to larger ones and unseen network topologies, achieve higher returns and lower variance than a state-of-the-art MARL baseline while preserving stability.
- Abstract(参考訳): 我々は強化学習を通じてネットワークシステムの分散制御について研究し、そこではニューラルポリシーは同時にスケーラブルで表現力があり、安定化されなければならない。
本稿では,グラフニューラルネットワーク(GNN)をYoulaのような規模指向パラメータ化に組み込むポリシパラメータ化を導入し,ネットワークレベルのクローズドループ安定性を設計によって保証する分散確率的コントローラを実現する。
この大きさは、乱れフィードバックに作用するGNNと、局所的な観測に作用するGNNからなる安定作用素として実装される。
グラフトポロジとモデルパラメータの両方の摂動に対する閉ループの頑健さを証明し、パラメータ化を近似ポリシー最適化と統合する方法を示す。
マルチエージェントナビゲーションタスクの実験では、小さなネットワークで訓練されたポリシーが、より大きなネットワークと見えないネットワークトポロジに直接転送され、安定性を維持しながら、最先端のMARLベースラインよりも高いリターンと低い分散を達成する。
関連論文リスト
- Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.47948583452555]
固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。
SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。
この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文 参考訳(メタデータ) (2025-10-17T07:43:51Z) - Structured Deep Neural Network-Based Backstepping Trajectory Tracking Control for Lagrangian Systems [9.61674297336072]
提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文 参考訳(メタデータ) (2024-03-01T09:09:37Z) - Stability of Neural Networks on Manifolds to Relative Perturbations [118.84154142918214]
グラフニューラルネットワーク(GNN)は多くの実践シナリオにおいて素晴らしいパフォーマンスを示している。
GNNは大規模グラフ上でうまくスケールすることができるが、これは既存の安定性がノード数とともに増加するという事実に矛盾する。
論文 参考訳(メタデータ) (2021-10-10T04:37:19Z) - Training Stable Graph Neural Networks Through Constrained Learning [116.03137405192356]
グラフニューラルネットワーク(GNN)は、ネットワークデータから機能を学ぶためにグラフ畳み込みに依存する。
GNNは、グラフフィルタから受け継いだ特性である、基礎となるグラフの様々な種類の摂動に対して安定である。
本稿では,GNNの安定条件に制約を課すことにより,新たな制約付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-07T15:54:42Z) - Space-Time Graph Neural Networks [104.55175325870195]
本研究では、時空間グラフニューラルネットワーク(ST-GNN)を導入し、時間変動ネットワークデータの時空間トポロジを共同処理する。
解析の結果,システムのネットワークトポロジと時間進化の変動はST-GNNの性能に大きく影響しないことがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:08:44Z) - Robust Stability of Neural-Network Controlled Nonlinear Systems with
Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。
このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文 参考訳(メタデータ) (2021-09-13T05:09:30Z) - Stability to Deformations of Manifold Filters and Manifold Neural Networks [89.53585099149973]
本論文は、多様体(M)畳み込みフィルタとニューラルネットワーク(NN)を定義し、研究する。
この論文の主な技術的貢献は、多様体の滑らかな変形に対する多様体フィルタとMNNの安定性を分析することである。
論文 参考訳(メタデータ) (2021-06-07T15:41:03Z) - Resource Allocation via Graph Neural Networks in Free Space Optical
Fronthaul Networks [119.81868223344173]
本稿では,自由空間光(FSO)フロントホールネットワークにおける最適資源割り当てについて検討する。
我々は、FSOネットワーク構造を利用するために、ポリシーパラメータ化のためのグラフニューラルネットワーク(GNN)を検討する。
本アルゴリズムは,システムモデルに関する知識が不要なモデルフリーでGNNを訓練するために開発された。
論文 参考訳(メタデータ) (2020-06-26T14:20:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。