論文の概要: Dynamic Simplex: Balancing Safety and Performance in Autonomous Cyber
Physical Systems
- arxiv url: http://arxiv.org/abs/2302.09750v1
- Date: Mon, 20 Feb 2023 04:00:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 16:46:28.147537
- Title: Dynamic Simplex: Balancing Safety and Performance in Autonomous Cyber
Physical Systems
- Title(参考訳): dynamic simplex: 自律サイバー物理システムにおける安全性とパフォーマンスのバランス
- Authors: Baiting Luo, Shreyas Ramakrishna, Ava Pettet, Christopher Kuhn, Gabor
Karsai, Ayan Mukhopadhyay
- Abstract要約: 本稿では,双方向スイッチングが可能なオンラインコントローラスイッチングロジックを用いたシンプルな戦略を提案する。
提案手法は, 現状技術よりも衝突が少なく, 性能も高いことを示す。
- 参考スコア(独自算出の注目度): 1.3309898919316483
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Learning Enabled Components (LEC) have greatly assisted cyber-physical
systems in achieving higher levels of autonomy. However, LEC's susceptibility
to dynamic and uncertain operating conditions is a critical challenge for the
safety of these systems. Redundant controller architectures have been widely
adopted for safety assurance in such contexts. These architectures augment LEC
"performant" controllers that are difficult to verify with "safety" controllers
and the decision logic to switch between them. While these architectures ensure
safety, we point out two limitations. First, they are trained offline to learn
a conservative policy of always selecting a controller that maintains the
system's safety, which limits the system's adaptability to dynamic and
non-stationary environments. Second, they do not support reverse switching from
the safety controller to the performant controller, even when the threat to
safety is no longer present. To address these limitations, we propose a dynamic
simplex strategy with an online controller switching logic that allows two-way
switching. We consider switching as a sequential decision-making problem and
model it as a semi-Markov decision process. We leverage a combination of a
myopic selector using surrogate models (for the forward switch) and a
non-myopic planner (for the reverse switch) to balance safety and performance.
We evaluate this approach using an autonomous vehicle case study in the CARLA
simulator using different driving conditions, locations, and component
failures. We show that the proposed approach results in fewer collisions and
higher performance than state-of-the-art alternatives.
- Abstract(参考訳): 学習可能コンポーネント(LEC)は、より高いレベルの自律性を達成するために、サイバー物理システムを大いに助けてきた。
しかし、LECの動的かつ不確実な動作条件への感受性は、これらのシステムの安全性にとって重要な課題である。
このような状況において、冗長コントローラアーキテクチャは安全性を保証するために広く採用されている。
これらのアーキテクチャにより、LECの"パフォーマンス"コントローラが強化され、"安全"コントローラで検証しにくくなり、その間の切り替えが決定される。
これらのアーキテクチャは安全性を保証するが、2つの制限を指摘した。
まず、システムの安全性を維持するコントローラを常に選択する保守的なポリシーを学習するためにオフラインでトレーニングされ、システムの動的および非定常環境への適応性を制限する。
第2に、安全に対する脅威がもはや存在しない場合でも、安全制御装置からパフォーマンスコントローラへのリバーススイッチをサポートしない。
これらの制約に対処するため,オンラインコントローラスイッチングロジックを用いた動的シンプル化戦略を提案し,双方向スイッチングを実現する。
スイッチングをシーケンシャルな意思決定問題として検討し,半マルコフ決定プロセスとしてモデル化する。
安全性と性能のバランスをとるために,サロゲートモデル(フォワードスイッチ)と非ミオピックプランナー(リバーススイッチ)を用いたミオピックセレクタの組み合わせを利用する。
我々は、異なる運転条件、位置、部品故障を用いたCARLAシミュレーターにおける自動運転車ケーススタディを用いてこのアプローチを評価する。
提案手法は,最先端の代替品よりも衝突が少なく,高い性能をもたらすことを示す。
関連論文リスト
- Modular Control Architecture for Safe Marine Navigation: Reinforcement Learning and Predictive Safety Filters [0.0]
強化学習は複雑なシナリオに適応するためにますます使われていますが、安全性と安定性を保証するための標準フレームワークは欠如しています。
予測安全フィルタ(PSF)は、明示的な制約処理を伴わずに、学習ベースの制御における制約満足度を確保する、有望なソリューションを提供する。
この手法を海洋航法に適用し,シミュレーションされたCybership IIモデル上でRLとPSFを組み合わせた。
その結果, PSF が安全維持に有効であることは, RL エージェントの学習速度と性能を損なうことなく示され, PSF を使用せずに標準 RL エージェントに対して評価された。
論文 参考訳(メタデータ) (2023-12-04T12:37:54Z) - Safe Deep Policy Adaptation [7.2747306035142225]
強化学習(RL)に基づく政策適応は、汎用性と汎用性を提供するが、安全性と堅牢性に挑戦する。
政策適応と安全強化学習の課題を同時に解決する新しいRLおよび制御フレームワークであるSafeDPAを提案する。
我々は、SafeDPAの理論的安全性を保証し、学習エラーや余分な摂動に対するSafeDPAの堅牢性を示す。
論文 参考訳(メタデータ) (2023-10-08T00:32:59Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - A Safety-Critical Decision Making and Control Framework Combining
Machine Learning and Rule-based Algorithms [15.613795936398606]
ルールベースの手法は安全クリティカルなシステムにおいて支配的だが、後者は複数の要件に対する堅牢性において第一の手法と競合することができない。
本稿では,ルールと機械学習の両手法の利点を生かした意思決定と制御の枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-30T13:58:51Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z) - High-level Decisions from a Safe Maneuver Catalog with Reinforcement
Learning for Safe and Cooperative Automated Merging [5.732271870257913]
統合シナリオにおける安全かつ協調的な自動運転のための効率的なRLに基づく意思決定パイプラインを提案する。
提案するRLエージェントは、車両状態履歴から協調運転者を効率よく識別し、対話的な操作を生成する。
論文 参考訳(メタデータ) (2021-07-15T15:49:53Z) - Non-stationary Online Learning with Memory and Non-stochastic Control [71.14503310914799]
我々は,過去の決定に依拠する損失関数を許容するメモリを用いたオンライン凸最適化(OCO)の問題について検討する。
本稿では,非定常環境に対してロバストなアルゴリズムを設計するための性能指標として,動的ポリシーの後悔を紹介する。
我々は,時間的地平線,非定常度,メモリ長といった面で,最適な動的ポリシーの後悔を確実に享受するメモリ付きOCOの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T09:45:15Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Runtime Safety Assurance Using Reinforcement Learning [37.61747231296097]
本稿では,安全でない状況を高精度に識別できるメタコントローラを設計することを目的とする。
我々は,RTSAの設計をマルコフ決定プロセス(MDP)と組み合わせ,強化学習(RL)を用いて解決する。
論文 参考訳(メタデータ) (2020-10-20T20:54:46Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。