論文の概要: Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation
- arxiv url: http://arxiv.org/abs/2504.21643v1
- Date: Wed, 30 Apr 2025 13:47:25 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-05-02 16:02:57.505939
- Title: Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation
- Title(参考訳): 安全強化学習ナビゲーションのための確率列挙による制御バリア関数の設計
- Authors: Luca Marzari, Francesco Trotti, Enrico Marchesini, Alessandro Farinelli,
- Abstract要約: 本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
- 参考スコア(独自算出の注目度): 55.02966123945644
- License:
- Abstract: Achieving safe autonomous navigation systems is critical for deploying robots in dynamic and uncertain real-world environments. In this paper, we propose a hierarchical control framework leveraging neural network verification techniques to design control barrier functions (CBFs) and policy correction mechanisms that ensure safe reinforcement learning navigation policies. Our approach relies on probabilistic enumeration to identify unsafe regions of operation, which are then used to construct a safe CBF-based control layer applicable to arbitrary policies. We validate our framework both in simulation and on a real robot, using a standard mobile robot benchmark and a highly dynamic aquatic environmental monitoring task. These experiments demonstrate the ability of the proposed solution to correct unsafe actions while preserving efficient navigation behavior. Our results show the promise of developing hierarchical verification-based systems to enable safe and robust navigation behaviors in complex scenarios.
- Abstract(参考訳): 安全な自律ナビゲーションシステムを実現することは、動的で不確実な現実世界環境にロボットを配置する上で非常に重要である。
本稿では,ニューラルネットワーク検証技術を活用した階層型制御フレームワークを提案する。
提案手法は,安全でない操作領域を特定するための確率的列挙に依存し,任意のポリシーに適合する安全なCBFベースの制御層を構築するために使用される。
我々は,標準的な移動ロボットベンチマークと高度に動的な環境モニタリングタスクを用いて,シミュレーションおよび実ロボット上でのフレームワークの有効性を検証する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
以上の結果から,複雑なシナリオにおける安全かつ堅牢なナビゲーション動作を可能にする階層的検証ベースシステムの開発が期待できることを示す。
関連論文リスト
- Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation [7.339743259039457]
本稿では,階層的強化学習(HRL)を利用した安全な地図レスナビゲーションフレームワークを提案する。
その結果,HRLに基づくナビゲーションフレームワークは静的シナリオと動的シナリオの両方で優れていることがわかった。
本研究では,物理的な検証実験を行うために,TurtleBot3ロボット上にHRLベースのナビゲーションフレームワークを実装した。
論文 参考訳(メタデータ) (2025-03-15T08:03:50Z) - Soft Actor-Critic-based Control Barrier Adaptation for Robust Autonomous Navigation in Unknown Environments [4.788163807490197]
制御バリア関数(CBF)の制約パラメータを実行時に適用するためのソフトアクタ・クリティカル(SAC)ベースのポリシーを提案する。
我々は,本フレームワークがCBF制約を効果的に適用し,ロボットが安全性を損なうことなく最終目標に達することを実証した。
論文 参考訳(メタデータ) (2025-03-11T14:33:55Z) - Safe LLM-Controlled Robots with Formal Guarantees via Reachability Analysis [0.6749750044497732]
本稿では,Large Language Models (LLM) 制御ロボットを対象とした,データ駆動型リーチビリティ解析に基づく安全保証フレームワークを提案する。
我々のアプローチは、明示的な分析モデルに頼ることなく、安全でない行動に対する厳密な安全保証を提供する。
論文 参考訳(メタデータ) (2025-03-05T21:23:15Z) - Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.267574471145217]
Hamilton-Jacobi (H) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。
生観測データを直接操作する潜在空間到達性であるLa Safety Filtersを提案する。
論文 参考訳(メタデータ) (2025-02-02T22:00:20Z) - One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments [10.103090762559708]
観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。
我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。
提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
論文 参考訳(メタデータ) (2024-12-13T09:21:02Z) - Online Control Barrier Functions for Decentralized Multi-Agent
Navigation [15.876920170393168]
制御バリア関数(CBF)は、連続領域における安全なマルチエージェントナビゲーションを可能にする。
伝統的なアプローチでは、パラメータが Apriori にチューニングされる固定CBF を考える。
オンラインCBFを提案し、ハイパーパラメータをリアルタイムに調整する。
論文 参考訳(メタデータ) (2023-03-08T01:28:18Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。