論文の概要: It's Time to Play Safe: Shield Synthesis for Timed Systems
- arxiv url: http://arxiv.org/abs/2006.16688v1
- Date: Tue, 30 Jun 2020 11:21:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 06:24:15.712796
- Title: It's Time to Play Safe: Shield Synthesis for Timed Systems
- Title(参考訳): 安全を追求する時が来た: タイムドシステムのためのシールド合成
- Authors: Roderick Bloem, Peter Gj{\o}l Jensen, Bettina K\"onighofer, Kim
Guldstrand Larsen, Florian Lorber and Alexander Palmisano
- Abstract要約: タイムド・オートマトンとして与えられるタイムド・セーフティ特性からタイムド・シールドを合成する方法を示す。
時間付きシールドは、可能な限りシステムに干渉しながら、ランニングシステムの安全性を強制する。
- 参考スコア(独自算出の注目度): 53.796331564067835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Erroneous behaviour in safety critical real-time systems may inflict serious
consequences. In this paper, we show how to synthesize timed shields from timed
safety properties given as timed automata. A timed shield enforces the safety
of a running system while interfering with the system as little as possible. We
present timed post-shields and timed pre-shields. A timed pre-shield is placed
before the system and provides a set of safe outputs. This set restricts the
choices of the system. A timed post-shield is implemented after the system. It
monitors the system and corrects the system's output only if necessary. We
further extend the timed post-shield construction to provide a guarantee on the
recovery phase, i.e., the time between a specification violation and the point
at which full control can be handed back to the system. In our experimental
results, we use timed post-shields to ensure the safety in a reinforcement
learning setting for controlling a platoon of cars, during the learning and
execution phase, and study the effect.
- Abstract(参考訳): 安全クリティカルリアルタイムシステムの誤った振る舞いは深刻な結果をもたらす可能性がある。
本稿では,タイムド・オートマトンとして与えられる安全特性からタイムド・シールドを合成する方法を示す。
時間付きシールドは、可能な限りシステムに干渉しながら、ランニングシステムの安全性を強制する。
時間付きプレシールドと時間付きプレシールドを提示する。
タイムドプレシールドはシステムの前に置かれ、安全な出力のセットを提供する。
このセットはシステムの選択を制限する。
タイムドポストシールドはシステム後に実装される。
システムを監視し、必要に応じてのみシステムの出力を補正する。
さらに、タイムドポストシールド構造を拡張して、リカバリフェーズ、すなわち、仕様違反からシステムへの完全な制御が返される時点までの時間を保証する。
実験結果では, 車両小隊制御のための強化学習環境において, 小隊の学習・実行段階における安全を確保するために, 時間付きポストシールドを用い, その効果について検討した。
関連論文リスト
- Compositional Shielding and Reinforcement Learning for Multi-Agent Systems [1.124958340749622]
高度な強化学習は、高性能なポリシーを得るための強力なツールとして登場した。
安全を保証するための有望なパラダイムの1つは、安全でない行動からポリシーを守るシールドである。
本研究では,マルチエージェント遮蔽のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-14T12:52:48Z) - Synthesizing Efficient and Permissive Programmatic Runtime Shields for Neural Policies [7.831197018945118]
ニューラルポリシーのための軽量でパーミッシブなプログラム型ランタイムシールドを合成する新しいフレームワークを提案する。
Aegisは、スケッチベースのプログラム合成問題としてランタイムシールドの探索を定式化することでこれを達成している。
現在の最先端と比較すると、イージスのシールドは時間オーバーヘッドの2.1$times$とメモリ使用量の4.4$times$である。
論文 参考訳(メタデータ) (2024-10-08T02:44:55Z) - Shielded Reinforcement Learning for Hybrid Systems [1.0485739694839669]
強化学習は、ほぼ最適に近いコントローラを構築するために利用されてきたが、それらの動作は安全であると保証されていない。
学習したコントローラーに安全を課す方法の1つは、設計によって正しいシールドを使用することである。
本研究では,いわゆる野蛮な手法によるシールドの構築を提案し,基礎となるパーティションベースの2プレーヤ安全ゲームの近似有限表現を抽出する。
論文 参考訳(メタデータ) (2023-08-28T09:04:52Z) - Safety Shielding under Delayed Observation [59.86192283565134]
シールドは安全な実行を保証するコンストラクション・バイ・コンストラクション・インストラクタである。
シールドは、将来の干渉が最小化される可能性が最も高い方法で、安全な修正行動を選択するべきである。
現実的な運転シミュレータにおけるシールドの最初の統合について述べる。
論文 参考訳(メタデータ) (2023-07-05T10:06:10Z) - Approximate Shielding of Atari Agents for Safe Exploration [83.55437924143615]
遮蔽の概念に基づく安全な探索のための原理的アルゴリズムを提案する。
本稿では,我々の近似遮蔽アルゴリズムが安全違反率を効果的に低減することを示す予備的な結果を示す。
論文 参考訳(メタデータ) (2023-04-21T16:19:54Z) - Forecasting Particle Accelerator Interruptions Using Logistic LASSO
Regression [62.997667081978825]
インターロックと呼ばれる予期せぬ粒子加速器の割り込みは、必要な安全対策にもかかわらず、突然の運用変更を引き起こす。
このような中断を予測することを目的とした,単純かつ強力なバイナリ分類モデルを提案する。
このモデルは、少なくとも絶対収縮と選択演算子によって罰せられるロジスティック回帰として定式化される。
論文 参考訳(メタデータ) (2023-03-15T23:11:30Z) - Online Shielding for Reinforcement Learning [59.86192283565134]
RLエージェントのオンライン安全保護のためのアプローチを提案する。
実行中、シールドは利用可能な各アクションの安全性を分析する。
この確率と与えられた閾値に基づいて、シールドはエージェントからのアクションをブロックするかを決定する。
論文 参考訳(メタデータ) (2022-12-04T16:00:29Z) - Sample-Efficient Safety Assurances using Conformal Prediction [57.92013073974406]
早期警戒システムは、安全でない状況が差し迫ったときに警告を提供することができる。
安全性を確実に向上させるためには、これらの警告システムは証明可能な偽陰性率を持つべきである。
本稿では,共形予測と呼ばれる統計的推論手法とロボット・環境力学シミュレータを組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-28T23:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。