論文の概要: Distributed Algorithms for Linearly-Solvable Optimal Control in
Networked Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2102.09104v1
- Date: Thu, 18 Feb 2021 01:31:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:07:18.088513
- Title: Distributed Algorithms for Linearly-Solvable Optimal Control in
Networked Multi-Agent Systems
- Title(参考訳): ネットワーク型マルチエージェントシステムにおける線形解法最適制御のための分散アルゴリズム
- Authors: Neng Wan, Aditya Gahlawat, Naira Hovakimyan, Evangelos A. Theodorou,
Petros G. Voulgaris
- Abstract要約: ネットワーク化されたMASの最適制御問題を複数の局所最適制御問題に分割する分散フレームワークを提案する。
離散時間系では、各サブシステムの合同ベルマン方程式は線形方程式系に変換される。
連続時間系では、各サブシステムの合同最適方程式は線形偏微分方程式に変換される。
- 参考スコア(独自算出の注目度): 15.782670973813774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distributed algorithms for both discrete-time and continuous-time linearly
solvable optimal control (LSOC) problems of networked multi-agent systems
(MASs) are investigated in this paper. A distributed framework is proposed to
partition the optimal control problem of a networked MAS into several local
optimal control problems in factorial subsystems, such that each (central)
agent behaves optimally to minimize the joint cost function of a subsystem that
comprises a central agent and its neighboring agents, and the local control
actions (policies) only rely on the knowledge of local observations. Under this
framework, we not only preserve the correlations between neighboring agents,
but moderate the communication and computational complexities by decentralizing
the sampling and computational processes over the network. For discrete-time
systems modeled by Markov decision processes, the joint Bellman equation of
each subsystem is transformed into a system of linear equations and solved
using parallel programming. For continuous-time systems modeled by It\^o
diffusion processes, the joint optimality equation of each subsystem is
converted into a linear partial differential equation, whose solution is
approximated by a path integral formulation and a sample-efficient relative
entropy policy search algorithm, respectively. The learned control policies are
generalized to solve the unlearned tasks by resorting to the compositionality
principle, and illustrative examples of cooperative UAV teams are provided to
verify the effectiveness and advantages of these algorithms.
- Abstract(参考訳): 本稿では,ネットワーク型マルチエージェントシステム(MAS)の離散時間および連続時間線形可解最適制御(LSOC)問題に対する分散アルゴリズムについて検討する。
分散フレームワークは、ネットワーク化されたMASの最適制御問題を、各(中央)エージェントが中央エージェントとその周辺エージェントからなるサブシステムの結合コスト関数を最小限に抑えるために最適に振る舞うように、要因的サブシステム内の複数の局所的最適制御問題に分割するために提案され、局所制御行動(政治)は局所観測の知識にのみ依存する。
この枠組みでは,隣接エージェント間の相関を保存できるだけでなく,ネットワーク上のサンプリング処理と計算処理を分散することで通信と計算の複雑さを緩和する。
マルコフ決定過程によってモデル化された離散時間系では、各サブシステムのジョイントベルマン方程式は線形方程式系に変換され、並列プログラミングを用いて解かれる。
It\^o拡散過程をモデルとした連続時間系では、各サブシステムの共同最適度方程式が線形偏微分方程式に変換され、その解はそれぞれパス積分公式とサンプル効率の相対的エントロピー政策探索アルゴリズムによって近似される。
学習された制御方針は構成性原理に依拠して未学習の課題を解決するために一般化され、これらのアルゴリズムの有効性と利点を検証するために協調uavチームの例が提供されている。
関連論文リスト
- Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - DESTRESS: Computation-Optimal and Communication-Efficient Decentralized
Nonconvex Finite-Sum Optimization [43.31016937305845]
インターネット・オブ・シング、ネットワークセンシング、自律システム、有限サム最適化のための分散アルゴリズムのためのフェデレーション学習。
非有限サム最適化のためのDecentralized STochastic Recursive MethodDESTRESSを開発した。
詳細な理論的および数値的な比較は、DESTRESSが事前の分散アルゴリズムにより改善されていることを示している。
論文 参考訳(メタデータ) (2021-10-04T03:17:41Z) - On Accelerating Distributed Convex Optimizations [0.0]
本稿では,分散マルチエージェント凸最適化問題について検討する。
提案アルゴリズムは, 従来の勾配偏光法よりも収束率を向上し, 線形収束することを示す。
実ロジスティック回帰問題の解法として,従来の分散アルゴリズムと比較して,アルゴリズムの性能が優れていることを示す。
論文 参考訳(メタデータ) (2021-08-19T13:19:54Z) - Lower Bounds and Optimal Algorithms for Smooth and Strongly Convex
Decentralized Optimization Over Time-Varying Networks [79.16773494166644]
通信ネットワークのノード間を分散的に保存するスムーズで強い凸関数の和を最小化するタスクについて検討する。
我々は、これらの下位境界を達成するための2つの最適アルゴリズムを設計する。
我々は,既存の最先端手法と実験的な比較を行うことにより,これらのアルゴリズムの理論的効率を裏付ける。
論文 参考訳(メタデータ) (2021-06-08T15:54:44Z) - A Two-stage Framework and Reinforcement Learning-based Optimization
Algorithms for Complex Scheduling Problems [54.61091936472494]
本稿では、強化学習(RL)と従来の運用研究(OR)アルゴリズムを組み合わせた2段階のフレームワークを開発する。
スケジューリング問題は,有限マルコフ決定過程 (MDP) と混合整数計画過程 (mixed-integer programming process) の2段階で解決される。
その結果,本アルゴリズムは,アジャイルな地球観測衛星スケジューリング問題に対して,安定かつ効率的に十分なスケジューリング計画を得ることができた。
論文 参考訳(メタデータ) (2021-03-10T03:16:12Z) - Cooperative Path Integral Control for Stochastic Multi-Agent Systems [20.731989147508983]
協調型マルチエージェントシステムのための分散最適制御ソリューションを提案する。
エージェントの局所的な観測のみに依存する局所的な制御行動は、サブシステムの共同コスト関数を最適化するために設計されている。
論文 参考訳(メタデータ) (2020-09-30T16:24:14Z) - Compositionality of Linearly Solvable Optimal Control in Networked
Multi-Agent Systems [27.544923751902807]
マルチエージェントシステム(MAS)における学習されたコンポーネントタスクから未学習の複合タスクへの最適制御則の一般化手法について議論する。
提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性と最適性を実現する。
論文 参考訳(メタデータ) (2020-09-28T20:21:48Z) - Distributed Optimization, Averaging via ADMM, and Network Topology [0.0]
センサローカライゼーションの現実問題において,ネットワークトポロジと異なるアルゴリズムの収束率の関係について検討する。
また、ADMMと持ち上げマルコフ連鎖の間の興味深い関係を示すとともに、その収束を明示的に特徴づける。
論文 参考訳(メタデータ) (2020-09-05T21:44:39Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - A Multi-Agent Primal-Dual Strategy for Composite Optimization over
Distributed Features [52.856801164425086]
目的関数を滑らかな局所関数と凸(おそらく非滑らか)結合関数の和とするマルチエージェント共有最適化問題について検討する。
論文 参考訳(メタデータ) (2020-06-15T19:40:24Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。