論文の概要: Cooperative Path Integral Control for Stochastic Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2009.14775v2
- Date: Sun, 21 Mar 2021 03:28:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 00:41:45.066271
- Title: Cooperative Path Integral Control for Stochastic Multi-Agent Systems
- Title(参考訳): 確率的マルチエージェントシステムのための協調経路積分制御
- Authors: Neng Wan, Aditya Gahlawat, Naira Hovakimyan, Evangelos A. Theodorou,
and Petros G. Voulgaris
- Abstract要約: 協調型マルチエージェントシステムのための分散最適制御ソリューションを提案する。
エージェントの局所的な観測のみに依存する局所的な制御行動は、サブシステムの共同コスト関数を最適化するために設計されている。
- 参考スコア(独自算出の注目度): 20.731989147508983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A distributed stochastic optimal control solution is presented for
cooperative multi-agent systems. The network of agents is partitioned into
multiple factorial subsystems, each of which consists of a central agent and
neighboring agents. Local control actions that rely only on agents' local
observations are designed to optimize the joint cost functions of subsystems.
When solving for the local control actions, the joint optimality equation for
each subsystem is cast as a linear partial differential equation and solved
using the Feynman-Kac formula. The solution and the optimal control action are
then formulated as path integrals and approximated by a Monte-Carlo method.
Numerical verification is provided through a simulation example consisting of a
team of cooperative UAVs.
- Abstract(参考訳): 協調型マルチエージェントシステムのための分散確率最適制御ソリューションを提案する。
エージェントのネットワークは複数の因子サブシステムに分割され、それぞれ中央エージェントと隣接エージェントで構成されている。
エージェントの局所観測のみに依存する局所制御アクションは、サブシステムの合同コスト関数を最適化するように設計されている。
局所制御作用を解くとき、各サブシステムの合同最適式を線形偏微分方程式としてキャストし、ファインマン・カック公式を用いて解く。
解と最適制御作用は経路積分として定式化され、モンテカルロ法で近似される。
数値検証は、協力型UAVチームからなるシミュレーション例を通して行われる。
関連論文リスト
- Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。
この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。
実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文 参考訳(メタデータ) (2023-12-04T16:49:43Z) - Optimal State Manipulation for a Two-Qubit System Driven by Coherent and
Incoherent Controls [77.34726150561087]
2量子ビット量子系の最適制御には状態準備が重要である。
物理的に異なる2つのコヒーレント制御を利用し、ヒルベルト・シュミット目標密度行列を最適化する。
論文 参考訳(メタデータ) (2023-04-03T10:22:35Z) - Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - Fully Decentralized, Scalable Gaussian Processes for Multi-Agent
Federated Learning [14.353574903736343]
マルチエージェントシステムにおけるGPトレーニングと予測のための分散およびスケーラブルなアルゴリズムを提案する。
提案手法の有効性を,合成および実データに関する数値実験で示す。
論文 参考訳(メタデータ) (2022-03-06T02:54:13Z) - Multi-Agent MDP Homomorphic Networks [100.74260120972863]
協調型マルチエージェントシステムでは、エージェントの異なる構成とそれらの局所的な観察の間に複雑な対称性が生じる。
単エージェント強化学習における既存の対称性の研究は、完全に集中した環境にのみ一般化できる。
本稿では,ローカル情報のみを用いた分散実行が可能なネットワークのクラスであるマルチエージェントMDPホモモルフィックネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-09T07:46:25Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Distributed Algorithms for Linearly-Solvable Optimal Control in
Networked Multi-Agent Systems [15.782670973813774]
ネットワーク化されたMASの最適制御問題を複数の局所最適制御問題に分割する分散フレームワークを提案する。
離散時間系では、各サブシステムの合同ベルマン方程式は線形方程式系に変換される。
連続時間系では、各サブシステムの合同最適方程式は線形偏微分方程式に変換される。
論文 参考訳(メタデータ) (2021-02-18T01:31:17Z) - Compositionality of Linearly Solvable Optimal Control in Networked
Multi-Agent Systems [27.544923751902807]
マルチエージェントシステム(MAS)における学習されたコンポーネントタスクから未学習の複合タスクへの最適制御則の一般化手法について議論する。
提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性と最適性を実現する。
論文 参考訳(メタデータ) (2020-09-28T20:21:48Z) - A Multi-Agent Primal-Dual Strategy for Composite Optimization over
Distributed Features [52.856801164425086]
目的関数を滑らかな局所関数と凸(おそらく非滑らか)結合関数の和とするマルチエージェント共有最適化問題について検討する。
論文 参考訳(メタデータ) (2020-06-15T19:40:24Z) - Distributed Voltage Regulation of Active Distribution System Based on
Enhanced Multi-agent Deep Reinforcement Learning [9.7314654861242]
本稿では,スペクトルクラスタリングと拡張マルチエージェント深部強化学習(MADRL)アルゴリズムに基づくデータ駆動分散電圧制御手法を提案する。
提案手法は,システムパラメータの通信と知識の要求を大幅に低減することができる。
また、不確実性を効果的に処理し、最新のローカル情報に基づいたオンライン協調制御を提供する。
論文 参考訳(メタデータ) (2020-05-31T15:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。