論文の概要: Decentralized Event-Triggered Online Learning for Safe Consensus of
Multi-Agent Systems with Gaussian Process Regression
- arxiv url: http://arxiv.org/abs/2402.03174v1
- Date: Mon, 5 Feb 2024 16:41:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 14:56:29.909516
- Title: Decentralized Event-Triggered Online Learning for Safe Consensus of
Multi-Agent Systems with Gaussian Process Regression
- Title(参考訳): 分散イベントトリガー型オンライン学習によるガウス過程回帰を伴うマルチエージェントシステムの安全なコンセンサス
- Authors: Xiaobing Dai, Zewen Yang, Mengtian Xu, Fangzhou Liu, Georges Hattab
and Sandra Hirche
- Abstract要約: 本稿では,補助力学によって強化された,学習に基づく分散制御法を提案する。
予測性能を継続的に向上するために、分散イベントトリガー機構を備えたデータ効率の高いオンライン学習戦略を提案する。
提案手法の有効性を示すため,従来の分散制御法とオフライン学習法を対比して比較分析を行った。
- 参考スコア(独自算出の注目度): 3.405252606286664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consensus control in multi-agent systems has received significant attention
and practical implementation across various domains. However, managing
consensus control under unknown dynamics remains a significant challenge for
control design due to system uncertainties and environmental disturbances. This
paper presents a novel learning-based distributed control law, augmented by an
auxiliary dynamics. Gaussian processes are harnessed to compensate for the
unknown components of the multi-agent system. For continuous enhancement in
predictive performance of Gaussian process model, a data-efficient online
learning strategy with a decentralized event-triggered mechanism is proposed.
Furthermore, the control performance of the proposed approach is ensured via
the Lyapunov theory, based on a probabilistic guarantee for prediction error
bounds. To demonstrate the efficacy of the proposed learning-based controller,
a comparative analysis is conducted, contrasting it with both conventional
distributed control laws and offline learning methodologies.
- Abstract(参考訳): マルチエージェントシステムにおけるコンセンサス制御は、様々なドメインにまたがって大きな注目を集め、実践的に実装されている。
しかし, システムの不確実性や環境障害などにより, 制御設計におけるコンセンサス管理は, 依然として重要な課題である。
本稿では,補助動力学によって拡張された新しい学習に基づく分散制御則を提案する。
ガウス過程はマルチエージェントシステムの未知の成分を補うために利用される。
ガウス過程モデルの予測性能の継続的な向上のために,分散イベントトリガ機構を用いたデータ効率の高いオンライン学習戦略を提案する。
さらに,予測誤差境界に対する確率的保証に基づいて,リアプノフ理論により提案手法の制御性能が保証される。
提案手法の有効性を示すために,従来の分散制御法とオフライン学習法とを比較し,比較分析を行った。
関連論文リスト
- Cooperative Learning with Gaussian Processes for Euler-Lagrange Systems
Tracking Control under Switching Topologies [9.838373797093245]
本研究は,Euler-Lagrangeマルチエージェントシステムのトラッキング制御問題に取り組むための,革新的な学習ベースアプローチを提案する。
特筆すべき特徴は、達成した凝集重量を導出する際の例外的な効率である。
シミュレーション実験は、複雑なシナリオを効果的に管理するためのプロトコルの有効性を検証する。
論文 参考訳(メタデータ) (2024-02-05T14:33:52Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Distributionally Robust Statistical Verification with Imprecise Neural
Networks [4.094049541486327]
AI安全性における特に困難な問題は、高次元自律システムの振る舞いを保証することだ。
本稿では,アクティブラーニング,不確実性定量化,ニューラルネットワーク検証を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-28T18:06:24Z) - Learning-Based Optimal Control with Performance Guarantees for Unknown Systems with Latent States [4.4820711784498]
本稿では,潜在状態を持つ未知非線形系に対する最適入力軌道の計算法を提案する。
提案手法の有効性を数値シミュレーションで示す。
論文 参考訳(メタデータ) (2023-03-31T11:06:09Z) - Model Predictive Control with Gaussian-Process-Supported Dynamical
Constraints for Autonomous Vehicles [82.65261980827594]
本研究では、学習したガウス過程を利用して人間の運転行動を予測する自動運転車のモデル予測制御手法を提案する。
マルチモード予測制御アプローチは、人間のドライバーの意図を考察する。
論文 参考訳(メタデータ) (2023-03-08T17:14:57Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Deep Learning Explicit Differentiable Predictive Control Laws for
Buildings [1.4121977037543585]
未知の非線形システムに対する制約付き制御法を学習するための微分予測制御(DPC)手法を提案する。
DPCは、明示的非線形モデル予測制御(MPC)から生じるマルチパラメトリックプログラミング問題に対する近似解を提供する
論文 参考訳(メタデータ) (2021-07-25T16:47:57Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Lyapunov-Based Reinforcement Learning for Decentralized Multi-Agent
Control [3.3788926259119645]
分散マルチエージェント制御では、システムは未知あるいは非常に不確実なダイナミクスで複雑である。
深層強化学習(DRL)は、システムダイナミクスを知らずに、データからコントローラや政治を学ぶことを約束している。
既存のマルチエージェント強化学習(MARL)アルゴリズムは、マルチエージェントシステムの閉ループ安定性を保証することができない。
安定保証付き分散マルチエージェント制御のための新しいMARLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-20T06:11:42Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。