論文の概要: Cooperative Path Integral Control for Stochastic Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2009.14775v2
- Date: Sun, 21 Mar 2021 03:28:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 00:41:45.066271
- Title: Cooperative Path Integral Control for Stochastic Multi-Agent Systems
- Title(参考訳): 確率的マルチエージェントシステムのための協調経路積分制御
- Authors: Neng Wan, Aditya Gahlawat, Naira Hovakimyan, Evangelos A. Theodorou,
and Petros G. Voulgaris
- Abstract要約: 協調型マルチエージェントシステムのための分散最適制御ソリューションを提案する。
エージェントの局所的な観測のみに依存する局所的な制御行動は、サブシステムの共同コスト関数を最適化するために設計されている。
- 参考スコア(独自算出の注目度): 20.731989147508983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A distributed stochastic optimal control solution is presented for
cooperative multi-agent systems. The network of agents is partitioned into
multiple factorial subsystems, each of which consists of a central agent and
neighboring agents. Local control actions that rely only on agents' local
observations are designed to optimize the joint cost functions of subsystems.
When solving for the local control actions, the joint optimality equation for
each subsystem is cast as a linear partial differential equation and solved
using the Feynman-Kac formula. The solution and the optimal control action are
then formulated as path integrals and approximated by a Monte-Carlo method.
Numerical verification is provided through a simulation example consisting of a
team of cooperative UAVs.
- Abstract(参考訳): 協調型マルチエージェントシステムのための分散確率最適制御ソリューションを提案する。
エージェントのネットワークは複数の因子サブシステムに分割され、それぞれ中央エージェントと隣接エージェントで構成されている。
エージェントの局所観測のみに依存する局所制御アクションは、サブシステムの合同コスト関数を最適化するように設計されている。
局所制御作用を解くとき、各サブシステムの合同最適式を線形偏微分方程式としてキャストし、ファインマン・カック公式を用いて解く。
解と最適制御作用は経路積分として定式化され、モンテカルロ法で近似される。
数値検証は、協力型UAVチームからなるシミュレーション例を通して行われる。
関連論文リスト
- Hypernetwork-based approach for optimal composition design in partially controlled multi-agent systems [5.860363407227059]
部分的に制御されたマルチエージェントシステム(PCMAS)は、システムデザイナが管理する制御可能なエージェントと、自律的に動作する制御不能エージェントで構成されている。
本研究は,PCMASにおける最適構成設計問題に対処し,システム設計者の問題,制御不能エージェントの最適数とポリシー,制御不能エージェントの問題について検討する。
本稿では,システムの構成とエージェントポリシーを協調的に最適化する,新しいハイパーネットワークベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-18T07:35:24Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。
この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。
実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文 参考訳(メタデータ) (2023-12-04T16:49:43Z) - Optimal State Manipulation for a Two-Qubit System Driven by Coherent and
Incoherent Controls [77.34726150561087]
2量子ビット量子系の最適制御には状態準備が重要である。
物理的に異なる2つのコヒーレント制御を利用し、ヒルベルト・シュミット目標密度行列を最適化する。
論文 参考訳(メタデータ) (2023-04-03T10:22:35Z) - Fully Decentralized, Scalable Gaussian Processes for Multi-Agent
Federated Learning [14.353574903736343]
マルチエージェントシステムにおけるGPトレーニングと予測のための分散およびスケーラブルなアルゴリズムを提案する。
提案手法の有効性を,合成および実データに関する数値実験で示す。
論文 参考訳(メタデータ) (2022-03-06T02:54:13Z) - Multi-Agent MDP Homomorphic Networks [100.74260120972863]
協調型マルチエージェントシステムでは、エージェントの異なる構成とそれらの局所的な観察の間に複雑な対称性が生じる。
単エージェント強化学習における既存の対称性の研究は、完全に集中した環境にのみ一般化できる。
本稿では,ローカル情報のみを用いた分散実行が可能なネットワークのクラスであるマルチエージェントMDPホモモルフィックネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-09T07:46:25Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Distributed Algorithms for Linearly-Solvable Optimal Control in
Networked Multi-Agent Systems [15.782670973813774]
ネットワーク化されたMASの最適制御問題を複数の局所最適制御問題に分割する分散フレームワークを提案する。
離散時間系では、各サブシステムの合同ベルマン方程式は線形方程式系に変換される。
連続時間系では、各サブシステムの合同最適方程式は線形偏微分方程式に変換される。
論文 参考訳(メタデータ) (2021-02-18T01:31:17Z) - Compositionality of Linearly Solvable Optimal Control in Networked
Multi-Agent Systems [27.544923751902807]
マルチエージェントシステム(MAS)における学習されたコンポーネントタスクから未学習の複合タスクへの最適制御則の一般化手法について議論する。
提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性と最適性を実現する。
論文 参考訳(メタデータ) (2020-09-28T20:21:48Z) - A Multi-Agent Primal-Dual Strategy for Composite Optimization over
Distributed Features [52.856801164425086]
目的関数を滑らかな局所関数と凸(おそらく非滑らか)結合関数の和とするマルチエージェント共有最適化問題について検討する。
論文 参考訳(メタデータ) (2020-06-15T19:40:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。