Fugu-MT 論文翻訳(概要): One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments

論文の概要: One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments

arxiv url: http://arxiv.org/abs/2412.09989v1
Date: Fri, 13 Dec 2024 09:21:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-16 15:37:48.910262
Title: One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments
Title（参考訳）: 未知環境における四足歩行ナビゲーションのロバスト安全性
Authors: Albert Lin, Shuang Peng, Somil Bansal,
Abstract要約: 観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
参考スコア（独自算出の注目度）: 10.103090762559708
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As learning-based methods for legged robots rapidly grow in popularity, it is important that we can provide safety assurances efficiently across different controllers and environments. Existing works either rely on a priori knowledge of the environment and safety constraints to ensure system safety or provide assurances for a specific locomotion policy. To address these limitations, we propose an observation-conditioned reachability-based (OCR) safety-filter framework. Our key idea is to use an OCR value network (OCR-VN) that predicts the optimal control-theoretic safety value function for new failure regions and dynamic uncertainty during deployment time. Specifically, the OCR-VN facilitates rapid safety adaptation through two key components: a LiDAR-based input that allows the dynamic construction of safe regions in light of new obstacles and a disturbance estimation module that accounts for dynamics uncertainty in the wild. The predicted safety value function is used to construct an adaptive safety filter that overrides the nominal quadruped controller when necessary to maintain safety. Through simulation studies and hardware experiments on a Unitree Go1 quadruped, we demonstrate that the proposed framework can automatically safeguard a wide range of hierarchical quadruped controllers, adapts to novel environments, and is robust to unmodeled dynamics without a priori access to the controllers or environments - hence, "One Filter to Deploy Them All". The experiment videos can be found on the project website.
Abstract（参考訳）: 脚ロボットの学習ベースの手法が急速に普及するにつれて、さまざまなコントローラや環境に対して、安全保証を効率的に提供できることが重要である。既存の作業は、システムの安全性を確保するために環境と安全の制約の事前知識に頼るか、特定の移動ポリシーの保証を提供するかのいずれかである。これらの制約に対処するために,観測条件付き到達可能性に基づく安全フィルタフレームワークを提案する。我々はOCR値ネットワーク(OCR-VN)を用いて,新しい障害領域に対する最適制御理論的安全性値関数と,デプロイメント時の動的不確実性を予測する。具体的には、OCR-VNは2つの重要なコンポーネントによる迅速な安全適応を促進する。LiDARベースの入力で、新しい障害物に照らして安全な領域を動的に構築できる。予測された安全性値関数は、安全性を維持するために必要な場合には、名目上の四重化コントローラをオーバーライドする適応安全フィルタを構築するために使用される。シミュレーション研究とUnitree Go1のハードウェア実験を通じて、提案するフレームワークは、広範囲の階層的な4つ組コントローラを自動で保護し、新しい環境に適応し、コントローラや環境に事前アクセスすることなく、非モデル化された動的に堅牢であることを示す。実験ビデオはプロジェクトのWebサイトにある。

関連論文リスト

Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (2025-04-30T13:47:25Z)
SafeCast: Risk-Responsive Motion Forecasting for Autonomous Vehicles [12.607007386467329]
リスク応答型モーション予測モデルであるSafeCastを提案する。安全を意識した意思決定と不確実性を意識した適応性を統合する。我々のモデルは、軽量なアーキテクチャと低推論レイテンシを維持しながら、最先端(SOTA)の精度を実現する。
論文参考訳（メタデータ） (2025-03-28T15:38:21Z)
Soft Actor-Critic-based Control Barrier Adaptation for Robust Autonomous Navigation in Unknown Environments [4.788163807490197]
制御バリア関数(CBF)の制約パラメータを実行時に適用するためのソフトアクタ・クリティカル(SAC)ベースのポリシーを提案する。我々は,本フレームワークがCBF制約を効果的に適用し,ロボットが安全性を損なうことなく最終目標に達することを実証した。
論文参考訳（メタデータ） (2025-03-11T14:33:55Z)
Safe Deep Policy Adaptation [7.2747306035142225]
強化学習(RL)に基づく政策適応は、汎用性と汎用性を提供するが、安全性と堅牢性に挑戦する。政策適応と安全強化学習の課題を同時に解決する新しいRLおよび制御フレームワークであるSafeDPAを提案する。我々は、SafeDPAの理論的安全性を保証し、学習エラーや余分な摂動に対するSafeDPAの堅牢性を示す。
論文参考訳（メタデータ） (2023-10-08T00:32:59Z)
CaRT: Certified Safety and Robust Tracking in Learning-based Motion Planning for Multi-Agent Systems [7.77024796789203]
CaRTは、学習ベースのモーションプランニングポリシーの安全性と堅牢性を保証するために、新しい階層的な分散アーキテクチャである。定性障害や有界障害があっても,CaRTは軌道追跡誤差の安全性と指数関数性を保証する。本稿では, 非線形動作計画と制御問題のいくつかの例において, CaRTの有効性を実証する。
論文参考訳（メタデータ） (2023-07-13T21:51:29Z)
Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文参考訳（メタデータ） (2022-10-03T08:38:38Z)
Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文参考訳（メタデータ） (2022-09-29T20:49:25Z)
Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文参考訳（メタデータ） (2022-08-23T05:02:09Z)
BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文参考訳（メタデータ） (2021-11-22T15:38:11Z)
Pointwise Feasibility of Gaussian Process-based Safety-Critical Control under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文参考訳（メタデータ） (2021-06-13T23:08:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。