論文の概要: Cooperative Learning with Gaussian Processes for Euler-Lagrange Systems
Tracking Control under Switching Topologies
- arxiv url: http://arxiv.org/abs/2402.03048v1
- Date: Mon, 5 Feb 2024 14:33:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 15:45:30.435406
- Title: Cooperative Learning with Gaussian Processes for Euler-Lagrange Systems
Tracking Control under Switching Topologies
- Title(参考訳): スイッチング位相下でのオイラーラグランジュ系追従制御のためのガウス過程を用いた協調学習
- Authors: Zewen Yang, Songbo Dong, Armin Lederer, Xiaobing Dai, Siyu Chen,
Stefan Sosnowski, Georges Hattab, Sandra Hirche
- Abstract要約: 本研究は,Euler-Lagrangeマルチエージェントシステムのトラッキング制御問題に取り組むための,革新的な学習ベースアプローチを提案する。
特筆すべき特徴は、達成した凝集重量を導出する際の例外的な効率である。
シミュレーション実験は、複雑なシナリオを効果的に管理するためのプロトコルの有効性を検証する。
- 参考スコア(独自算出の注目度): 9.838373797093245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents an innovative learning-based approach to tackle the
tracking control problem of Euler-Lagrange multi-agent systems with partially
unknown dynamics operating under switching communication topologies. The
approach leverages a correlation-aware cooperative algorithm framework built
upon Gaussian process regression, which adeptly captures inter-agent
correlations for uncertainty predictions. A standout feature is its exceptional
efficiency in deriving the aggregation weights achieved by circumventing the
computationally intensive posterior variance calculations. Through Lyapunov
stability analysis, the distributed control law ensures bounded tracking errors
with high probability. Simulation experiments validate the protocol's efficacy
in effectively managing complex scenarios, establishing it as a promising
solution for robust tracking control in multi-agent systems characterized by
uncertain dynamics and dynamic communication structures.
- Abstract(参考訳): 本稿では,スイッチング通信トポロジの下で動作する部分未知のダイナミクスを持つeuler-lagrangeマルチエージェントシステムのトラッキング制御問題に取り組むための,革新的な学習ベースアプローチを提案する。
このアプローチは、不確実性予測のためにエージェント間相関を適切にキャプチャするガウス過程回帰に基づく相関認識協調アルゴリズムフレームワークを活用する。
際立った特徴は、計算量的に集中的な後方分散計算を回避して得られる凝集重みの導出において、その例外的な効率である。
Lyapunovの安定性解析を通じて、分散制御法則は有界追跡誤差を高い確率で保証する。
シミュレーション実験は、複雑なシナリオを効果的に管理することにおけるプロトコルの有効性を検証し、不確定なダイナミクスと動的通信構造を特徴とするマルチエージェントシステムにおける堅牢なトラッキング制御のための有望なソリューションとして確立する。
関連論文リスト
- Decentralized Event-Triggered Online Learning for Safe Consensus of
Multi-Agent Systems with Gaussian Process Regression [3.405252606286664]
本稿では,補助力学によって強化された,学習に基づく分散制御法を提案する。
予測性能を継続的に向上するために、分散イベントトリガー機構を備えたデータ効率の高いオンライン学習戦略を提案する。
提案手法の有効性を示すため,従来の分散制御法とオフライン学習法を対比して比較分析を行った。
論文 参考訳(メタデータ) (2024-02-05T16:41:17Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - IPCC-TP: Utilizing Incremental Pearson Correlation Coefficient for Joint
Multi-Agent Trajectory Prediction [73.25645602768158]
IPCC-TPはインクリメンタルピアソン相関係数に基づく新しい関連認識モジュールであり,マルチエージェントインタラクションモデリングを改善する。
我々のモジュールは、既存のマルチエージェント予測手法に便利に組み込んで、元の動き分布デコーダを拡張することができる。
論文 参考訳(メタデータ) (2023-03-01T15:16:56Z) - Guaranteed Trajectory Tracking under Learned Dynamics with Contraction Metrics and Disturbance Estimation [5.147919654191323]
本稿では,制約指標と外乱推定に基づく軌道中心学習制御へのアプローチを提案する。
提案するフレームワークは、平面四重項の例で検証される。
論文 参考訳(メタデータ) (2021-12-15T15:57:33Z) - Harnessing Heterogeneity: Learning from Decomposed Feedback in Bayesian
Modeling [68.69431580852535]
サブグループフィードバックを取り入れた新しいGPレグレッションを導入する。
我々の修正された回帰は、以前のアプローチと比べて、明らかにばらつきを減らし、したがってより正確な後続を減らした。
我々は2つの異なる社会問題に対してアルゴリズムを実行する。
論文 参考訳(メタデータ) (2021-07-07T03:57:22Z) - Trajectory Tracking of Underactuated Sea Vessels With Uncertain
Dynamics: An Integral Reinforcement Learning Approach [2.064612766965483]
積分強化学習に基づくオンライン機械学習メカニズムを提案し,非線形追跡問題のクラスに対する解を求める。
このソリューションは、適応的批評家と勾配降下アプローチを用いて実現されるオンライン価値反復プロセスを用いて実装される。
論文 参考訳(メタデータ) (2021-04-01T01:41:49Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Discrete Action On-Policy Learning with Action-Value Critic [72.20609919995086]
離散的な行動空間における強化学習(RL)は、実世界の応用では至るところで行われているが、その複雑さは行動空間次元とともに指数関数的に増大する。
我々は,行動値関数を推定し,相関行動に適用し,これらの評価値を組み合わせて勾配推定の分散を制御する。
これらの取り組みにより、分散制御技術に頼って、関連するRLアルゴリズムを実証的に上回る、新たな離散的なRLアルゴリズムが実現される。
論文 参考訳(メタデータ) (2020-02-10T04:23:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。