論文の概要: Non-Parametric Neuro-Adaptive Coordination of Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2110.05125v1
- Date: Mon, 11 Oct 2021 10:04:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 00:56:59.060464
- Title: Non-Parametric Neuro-Adaptive Coordination of Multi-Agent Systems
- Title(参考訳): マルチエージェントシステムの非パラメトリック神経適応協調
- Authors: Christos K. Verginis, Zhe Xu, Ufuk Topcu
- Abstract要約: ネットワーク化されたマルチエージェントシステムの分散生成制御のための学習に基づくアルゴリズムを開発した。
提案アルゴリズムは、ニューラルネットワークに基づく学習と適応制御を2段階の手順で統合する。
形成作業の達成に関する公式な理論的保証を提供する。
- 参考スコア(独自算出の注目度): 29.22096249070293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop a learning-based algorithm for the distributed formation control
of networked multi-agent systems governed by unknown, nonlinear dynamics. Most
existing algorithms either assume certain parametric forms for the unknown
dynamic terms or resort to unnecessarily large control inputs in order to
provide theoretical guarantees. The proposed algorithm avoids these drawbacks
by integrating neural network-based learning with adaptive control in a
two-step procedure. In the first step of the algorithm, each agent learns a
controller, represented as a neural network, using training data that
correspond to a collection of formation tasks and agent parameters. These
parameters and tasks are derived by varying the nominal agent parameters and
the formation specifications of the task in hand, respectively. In the second
step of the algorithm, each agent incorporates the trained neural network into
an online and adaptive control policy in such a way that the behavior of the
multi-agent closed-loop system satisfies a user-defined formation task. Both
the learning phase and the adaptive control policy are distributed, in the
sense that each agent computes its own actions using only local information
from its neighboring agents. The proposed algorithm does not use any a priori
information on the agents' unknown dynamic terms or any approximation schemes.
We provide formal theoretical guarantees on the achievement of the formation
task.
- Abstract(参考訳): 未知の非線形力学によって制御されるネットワーク型マルチエージェントシステムの分散生成制御のための学習ベースアルゴリズムを開発した。
既存のアルゴリズムの多くは、未知の動的項に対して特定のパラメトリック形式を仮定するか、理論的な保証を提供するために不要に大きな制御入力を利用する。
提案アルゴリズムは、ニューラルネットワークに基づく学習と適応制御を2段階の手順に統合することにより、これらの欠点を回避する。
アルゴリズムの最初のステップでは、生成タスクとエージェントパラメータの集合に対応するトレーニングデータを使用して、各エージェントがニューラルネットワークとして表現されたコントローラを学習する。
これらのパラメータとタスクは、それぞれ、目の前のタスクの名目エージェントパラメータと生成仕様を変化させて導出される。
アルゴリズムの第2ステップでは、訓練されたニューラルネットワークをオンラインおよび適応制御ポリシに組み込むことにより、マルチエージェントのクローズドループシステムの動作がユーザ定義の形成タスクを満たすようにする。
学習フェーズと適応制御ポリシの両方が分散され、各エージェントが隣のエージェントからのローカル情報のみを使用して独自のアクションを計算できる。
提案アルゴリズムはエージェントの未知の動的項や近似スキームに関する事前情報を使用しない。
我々は、形成作業の達成に関する正式な理論的保証を提供する。
関連論文リスト
- Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Joint Learning of Network Topology and Opinion Dynamics Based on Bandit
Algorithms [1.6912877206492036]
ネットワークトポロジと混合意見力学の合同学習について検討する。
本稿では,この問題に対処するためのマルチアームバンディットアルゴリズムに基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-25T21:53:13Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Scalable, Decentralized Multi-Agent Reinforcement Learning Methods
Inspired by Stigmergy and Ant Colonies [0.0]
分散型マルチエージェント学習と計画に対する新しいアプローチを検討する。
特に、この方法はアリコロニーの凝集、協調、行動に触発されている。
このアプローチは、単一エージェントRLと、マルチエージェントパス計画と環境修正のためのアリコロニーに触発された分散型のスティグメロジカルアルゴリズムを組み合わせたものである。
論文 参考訳(メタデータ) (2021-05-08T01:04:51Z) - Identification of Nonlinear Dynamic Systems Using Type-2 Fuzzy Neural
Networks -- A Novel Learning Algorithm and a Comparative Study [12.77304082363491]
スライディングモード理論に基づく学習アルゴリズムは、タイプ2ファジィニューラルネットワークの前提部分と結果部分の両方を調整するために提案されている。
提案アルゴリズムの安定性は、適切なリアプノフ関数を用いて証明されている。
いくつかの比較結果が得られ、提案アルゴリズムは既存の手法よりも高速な収束速度を持つことを示した。
論文 参考訳(メタデータ) (2021-04-04T23:44:59Z) - Detection of Insider Attacks in Distributed Projected Subgradient
Algorithms [11.096339082411882]
汎用ニューラルネットワークは悪質なエージェントの検出とローカライズに特に適していることを示す。
本稿では,連合学習における最先端のアプローチ,すなわち協調型ピアツーピア機械学習プロトコルを採用することを提案する。
シミュレーションでは,AIに基づく手法の有効性と有効性を検証するために,最小二乗問題を考える。
論文 参考訳(メタデータ) (2021-01-18T08:01:06Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z) - Adaptive Serverless Learning [114.36410688552579]
本研究では,データから学習率を動的に計算できる適応型分散学習手法を提案する。
提案アルゴリズムは, 作業者数に対して線形高速化が可能であることを示す。
通信効率のオーバーヘッドを低減するため,通信効率のよい分散訓練手法を提案する。
論文 参考訳(メタデータ) (2020-08-24T13:23:02Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z) - Distributed Voltage Regulation of Active Distribution System Based on
Enhanced Multi-agent Deep Reinforcement Learning [9.7314654861242]
本稿では,スペクトルクラスタリングと拡張マルチエージェント深部強化学習(MADRL)アルゴリズムに基づくデータ駆動分散電圧制御手法を提案する。
提案手法は,システムパラメータの通信と知識の要求を大幅に低減することができる。
また、不確実性を効果的に処理し、最新のローカル情報に基づいたオンライン協調制御を提供する。
論文 参考訳(メタデータ) (2020-05-31T15:48:27Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。