論文の概要: CART: Collision Avoidance and Robust Tracking Augmentation in
Learning-based Motion Planning for Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2307.08602v1
- Date: Thu, 13 Jul 2023 21:51:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 12:16:13.987676
- Title: CART: Collision Avoidance and Robust Tracking Augmentation in
Learning-based Motion Planning for Multi-Agent Systems
- Title(参考訳): CART:マルチエージェントシステムの学習型運動計画における衝突回避とロバスト追跡強化
- Authors: Hiroyasu Tsukamoto and Benjamin Rivi\`ere and Changrak Choi and Amir
Rahmani and Soon-Jo Chung
- Abstract要約: CARTは、リアルタイム衝突回避とロバストなトラッキング保証を備えた非線形マルチエージェントシステムの学習に基づく分散動作計画ポリシーを強化するための分析手法である。
まず,ラグランジアン系に対する最適安全フィルタの解析形式を導出し,乱れのない環境下でのマルチエージェント環境での衝突のない動作を正式に保証する。
本研究では, 宇宙船形成飛行やローター搭載Swarm UAVなどの非線形システムの動作計画と制御におけるCARTの有効性を示す。
- 参考スコア(独自算出の注目度): 5.054812811101635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents CART, an analytical method to augment a learning-based,
distributed motion planning policy of a nonlinear multi-agent system with
real-time collision avoidance and robust tracking guarantees, independently of
learning errors. We first derive an analytical form of an optimal safety filter
for Lagrangian systems, which formally ensures a collision-free operation in a
multi-agent setting in a disturbance-free environment, while allowing for its
distributed implementation with minimal deviation from the learned policy. We
then propose an analytical form of an optimal robust filter for Lagrangian
systems to be used hierarchically with the learned collision-free target
trajectory, which also enables distributed implementation and guarantees
exponential boundedness of the trajectory tracking error for safety, even under
the presence of deterministic and stochastic disturbance. These results are
shown to extend further to general control-affine nonlinear systems using
contraction theory. Our key contribution is to enhance the performance of the
learned motion planning policy with collision avoidance and tracking-based
robustness guarantees, independently of its original performance such as
approximation errors and regret bounds in machine learning. We demonstrate the
effectiveness of CART in motion planning and control of several examples of
nonlinear systems, including spacecraft formation flying and rotor-failed UAV
swarms.
- Abstract(参考訳): 本稿では,実時間衝突回避とロバスト追跡保証を備えた非線形マルチエージェントシステムの学習ベース分散動作計画ポリシを学習エラーとは無関係に拡張する解析手法であるcartを提案する。
まず,ラグランジアン系における最適安全フィルタの解析形式を導出し,乱れのない環境におけるマルチエージェント環境での衝突のない動作を公式に保証し,学習方針からのずれを最小限に抑えた分散実装を実現する。
そこで本研究では,ラグランジアン系に対する最適ロバストフィルタの解析形式を提案する。ラグランジアン系は無衝突目標軌道を階層的に使用し,決定論的かつ確率的外乱の存在下においても安全のための軌道追尾誤差の指数的有界性を保証する。
これらの結果は、収縮理論を用いて一般制御-アフィン非線形系にさらに拡張されることが示されている。
我々の重要な貢献は、衝突回避と追跡に基づく堅牢性を保証することで、機械学習における近似誤差や後悔境界といった本来の性能とは無関係に、学習された動き計画ポリシーの性能を向上させることである。
本研究では, 宇宙船形成飛行やローター故障型UAV群などの非線形システムの動作計画と制御におけるCARTの有効性を示す。
関連論文リスト
- ConstrainedZero: Chance-Constrained POMDP Planning using Learned Probabilistic Failure Surrogates and Adaptive Safety Constraints [34.9739641898452]
本研究では、最適値とポリシーのニューラルネットワーク近似を学習することにより、信念空間におけるCC-POMDPを解くConstrainedZeroポリシーアルゴリズムを導入する。
その結果, 目標から安全制約を分離することで, 報酬とコストのバランスを最適化することなく, 目標となる安全レベルを達成できることが示唆された。
論文 参考訳(メタデータ) (2024-05-01T17:17:22Z) - Learning Predictive Safety Filter via Decomposition of Robust Invariant
Set [6.94348936509225]
本稿では, RMPCとRL RLの併用による非線形システムの安全フィルタの合成について述べる。
本稿では,ロバストリーチ問題に対する政策アプローチを提案し,その複雑性を確立する。
論文 参考訳(メタデータ) (2023-11-12T08:11:28Z) - Multi-Step Model Predictive Safety Filters: Reducing Chattering by
Increasing the Prediction Horizon [7.55113002732746]
安全フィルタを用いて学習制御ポリシを増強することにより、状態と入力制約の満足度を保証できる。
モデル予測安全フィルタ(MPSF)は、モデル予測制御(MPC)に基づく一般的な安全フィルタリング手法である。
論文 参考訳(メタデータ) (2023-09-20T16:35:29Z) - ISAACS: Iterative Soft Adversarial Actor-Critic for Safety [0.9217021281095907]
この研究は、ロボットシステムのための堅牢な安全維持コントローラのスケーラブルな合成を可能にする新しいアプローチを導入する。
安全を追求するフォールバックポリシーは、モデルエラーの最悪のケースの実現を促進するために、敵の「混乱」エージェントと共同で訓練される。
学習した制御ポリシーは本質的に安全性を保証するものではないが、リアルタイムの安全フィルタを構築するために使用される。
論文 参考訳(メタデータ) (2022-12-06T18:53:34Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。