論文の概要: It's Time to Play Safe: Shield Synthesis for Timed Systems
- arxiv url: http://arxiv.org/abs/2006.16688v1
- Date: Tue, 30 Jun 2020 11:21:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 06:24:15.712796
- Title: It's Time to Play Safe: Shield Synthesis for Timed Systems
- Title(参考訳): 安全を追求する時が来た: タイムドシステムのためのシールド合成
- Authors: Roderick Bloem, Peter Gj{\o}l Jensen, Bettina K\"onighofer, Kim
Guldstrand Larsen, Florian Lorber and Alexander Palmisano
- Abstract要約: タイムド・オートマトンとして与えられるタイムド・セーフティ特性からタイムド・シールドを合成する方法を示す。
時間付きシールドは、可能な限りシステムに干渉しながら、ランニングシステムの安全性を強制する。
- 参考スコア(独自算出の注目度): 53.796331564067835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Erroneous behaviour in safety critical real-time systems may inflict serious
consequences. In this paper, we show how to synthesize timed shields from timed
safety properties given as timed automata. A timed shield enforces the safety
of a running system while interfering with the system as little as possible. We
present timed post-shields and timed pre-shields. A timed pre-shield is placed
before the system and provides a set of safe outputs. This set restricts the
choices of the system. A timed post-shield is implemented after the system. It
monitors the system and corrects the system's output only if necessary. We
further extend the timed post-shield construction to provide a guarantee on the
recovery phase, i.e., the time between a specification violation and the point
at which full control can be handed back to the system. In our experimental
results, we use timed post-shields to ensure the safety in a reinforcement
learning setting for controlling a platoon of cars, during the learning and
execution phase, and study the effect.
- Abstract(参考訳): 安全クリティカルリアルタイムシステムの誤った振る舞いは深刻な結果をもたらす可能性がある。
本稿では,タイムド・オートマトンとして与えられる安全特性からタイムド・シールドを合成する方法を示す。
時間付きシールドは、可能な限りシステムに干渉しながら、ランニングシステムの安全性を強制する。
時間付きプレシールドと時間付きプレシールドを提示する。
タイムドプレシールドはシステムの前に置かれ、安全な出力のセットを提供する。
このセットはシステムの選択を制限する。
タイムドポストシールドはシステム後に実装される。
システムを監視し、必要に応じてのみシステムの出力を補正する。
さらに、タイムドポストシールド構造を拡張して、リカバリフェーズ、すなわち、仕様違反からシステムへの完全な制御が返される時点までの時間を保証する。
実験結果では, 車両小隊制御のための強化学習環境において, 小隊の学習・実行段階における安全を確保するために, 時間付きポストシールドを用い, その効果について検討した。
関連論文リスト
- Shielded Reinforcement Learning for Hybrid Systems [1.0485739694839669]
強化学習は、ほぼ最適に近いコントローラを構築するために利用されてきたが、それらの動作は安全であると保証されていない。
学習したコントローラーに安全を課す方法の1つは、設計によって正しいシールドを使用することである。
本研究では,いわゆる野蛮な手法によるシールドの構築を提案し,基礎となるパーティションベースの2プレーヤ安全ゲームの近似有限表現を抽出する。
論文 参考訳(メタデータ) (2023-08-28T09:04:52Z) - Safety Shielding under Delayed Observation [59.86192283565134]
シールドは安全な実行を保証するコンストラクション・バイ・コンストラクション・インストラクタである。
シールドは、将来の干渉が最小化される可能性が最も高い方法で、安全な修正行動を選択するべきである。
現実的な運転シミュレータにおけるシールドの最初の統合について述べる。
論文 参考訳(メタデータ) (2023-07-05T10:06:10Z) - Approximate Shielding of Atari Agents for Safe Exploration [83.55437924143615]
遮蔽の概念に基づく安全な探索のための原理的アルゴリズムを提案する。
本稿では,我々の近似遮蔽アルゴリズムが安全違反率を効果的に低減することを示す予備的な結果を示す。
論文 参考訳(メタデータ) (2023-04-21T16:19:54Z) - Online Shielding for Reinforcement Learning [59.86192283565134]
RLエージェントのオンライン安全保護のためのアプローチを提案する。
実行中、シールドは利用可能な各アクションの安全性を分析する。
この確率と与えられた閾値に基づいて、シールドはエージェントからのアクションをブロックするかを決定する。
論文 参考訳(メタデータ) (2022-12-04T16:00:29Z) - Automata Learning meets Shielding [1.1417805445492082]
安全は、強化学習(RL)における主要な研究課題の1つである。
本稿では,確率的,部分的に未知な環境下での探査において,RLエージェントの安全違反を回避する方法について述べる。
提案手法は,マルコフ決定過程(MDP)の自動学習とシールド合成を反復的手法で組み合わせたものである。
論文 参考訳(メタデータ) (2022-12-04T14:58:12Z) - Recursively Feasible Probabilistic Safe Online Learning with Control
Barrier Functions [63.18590014127461]
本稿では,CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
本研究では,ロバストな安全クリティカルコントローラの実現可能性について検討する。
次に、これらの条件を使って、イベントトリガーによるオンラインデータ収集戦略を考案します。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Dynamic Shielding for Reinforcement Learning in Black-Box Environments [2.696933675395521]
サイバー物理システムにおける強化学習の利用は,学習中の安全性保証の欠如により困難である。
本稿では,事前のシステム知識を必要とせず,学習時の望ましくない行動を減らすことを目的とする。
本稿では,自動学習を用いた遮蔽と呼ばれるモデルベース安全なRL手法の拡張として,動的遮蔽を提案する。
論文 参考訳(メタデータ) (2022-07-27T10:54:05Z) - Sample-Efficient Safety Assurances using Conformal Prediction [57.92013073974406]
早期警戒システムは、安全でない状況が差し迫ったときに警告を提供することができる。
安全性を確実に向上させるためには、これらの警告システムは証明可能な偽陰性率を持つべきである。
本稿では,共形予測と呼ばれる統計的推論手法とロボット・環境力学シミュレータを組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-28T23:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。