論文の概要: Online Control Barrier Functions for Decentralized Multi-Agent
Navigation
- arxiv url: http://arxiv.org/abs/2303.04313v2
- Date: Fri, 8 Sep 2023 19:28:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 22:10:52.463059
- Title: Online Control Barrier Functions for Decentralized Multi-Agent
Navigation
- Title(参考訳): 分散マルチエージェントナビゲーションのためのオンライン制御バリア機能
- Authors: Zhan Gao and Guang Yang and Amanda Prorok
- Abstract要約: 制御バリア関数(CBF)は、連続領域における安全なマルチエージェントナビゲーションを可能にする。
伝統的なアプローチでは、パラメータが Apriori にチューニングされる固定CBF を考える。
オンラインCBFを提案し、ハイパーパラメータをリアルタイムに調整する。
- 参考スコア(独自算出の注目度): 15.876920170393168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Control barrier functions (CBFs) enable guaranteed safe multi-agent
navigation in the continuous domain. The resulting navigation performance,
however, is highly sensitive to the underlying hyperparameters. Traditional
approaches consider fixed CBFs (where parameters are tuned apriori), and hence,
typically do not perform well in cluttered and highly dynamic environments:
conservative parameter values can lead to inefficient agent trajectories, or
even failure to reach goal positions, whereas aggressive parameter values can
lead to infeasible controls. To overcome these issues, in this paper, we
propose online CBFs, whereby hyperparameters are tuned in real-time, as a
function of what agents perceive in their immediate neighborhood. Since the
explicit relationship between CBFs and navigation performance is hard to model,
we leverage reinforcement learning to learn CBF-tuning policies in a model-free
manner. Because we parameterize the policies with graph neural networks (GNNs),
we are able to synthesize decentralized agent controllers that adjust parameter
values locally, varying the degree of conservative and aggressive behaviors
across agents. Simulations as well as real-world experiments show that (i)
online CBFs are capable of solving navigation scenarios that are infeasible for
fixed CBFs, and (ii), that they improve navigation performance by adapting to
other agents and changes in the environment.
- Abstract(参考訳): 制御バリア関数(CBF)は、連続ドメインにおける安全なマルチエージェントナビゲーションを可能にする。
しかし、結果として生じるナビゲーション性能は、下層のハイパーパラメータに非常に敏感である。
伝統的なアプローチでは、固定されたCBF(パラメータがアプリロリにチューニングされる)を考えるため、通常、散らばったり非常にダイナミックな環境ではうまく機能しない:保守的なパラメータ値は非効率なエージェントの軌跡、あるいは目標位置に到達するのに失敗する。
これらの課題を克服するため,本論文では,ハイパーパラメータをリアルタイムに調整するオンラインCBFを提案する。
CBFとナビゲーション性能の明確な関係はモデル化が難しいため、強化学習を利用してCBFチューニングポリシーをモデル無しで学習する。
グラフニューラルネットワーク(GNN)でポリシーをパラメータ化するため、パラメータ値を局所的に調整し、エージェント間の保守的かつ攻撃的な行動の程度を変える分散エージェントコントローラを合成することができる。
シミュレーションと実世界の実験が示すのは
(i)オンラインCBFは、固定CBFでは不可能なナビゲーションシナリオを解くことができる。
(ii)他のエージェントや環境の変化に適応することで、ナビゲーション性能を向上させる。
関連論文リスト
- Domain Adaptive Safety Filters via Deep Operator Learning [5.62479170374811]
本稿では,環境パラメータから対応するCBFへのマッピングを学習する自己教師型深層演算子学習フレームワークを提案する。
動的障害物を含むナビゲーションタスクの数値実験により,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-10-18T15:10:55Z) - Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.166970599802324]
最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-03-26T02:49:08Z) - Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。