Fugu-MT 論文翻訳(概要): It's Time to Play Safe: Shield Synthesis for Timed Systems

論文の概要: It's Time to Play Safe: Shield Synthesis for Timed Systems

arxiv url: http://arxiv.org/abs/2006.16688v1
Date: Tue, 30 Jun 2020 11:21:42 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-15 06:24:15.712796
Title: It's Time to Play Safe: Shield Synthesis for Timed Systems
Title（参考訳）: 安全を追求する時が来た: タイムドシステムのためのシールド合成
Authors: Roderick Bloem, Peter Gj{\o}l Jensen, Bettina K\"onighofer, Kim Guldstrand Larsen, Florian Lorber and Alexander Palmisano
Abstract要約: タイムド・オートマトンとして与えられるタイムド・セーフティ特性からタイムド・シールドを合成する方法を示す。時間付きシールドは、可能な限りシステムに干渉しながら、ランニングシステムの安全性を強制する。
参考スコア（独自算出の注目度）: 53.796331564067835
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Erroneous behaviour in safety critical real-time systems may inflict serious consequences. In this paper, we show how to synthesize timed shields from timed safety properties given as timed automata. A timed shield enforces the safety of a running system while interfering with the system as little as possible. We present timed post-shields and timed pre-shields. A timed pre-shield is placed before the system and provides a set of safe outputs. This set restricts the choices of the system. A timed post-shield is implemented after the system. It monitors the system and corrects the system's output only if necessary. We further extend the timed post-shield construction to provide a guarantee on the recovery phase, i.e., the time between a specification violation and the point at which full control can be handed back to the system. In our experimental results, we use timed post-shields to ensure the safety in a reinforcement learning setting for controlling a platoon of cars, during the learning and execution phase, and study the effect.
Abstract（参考訳）: 安全クリティカルリアルタイムシステムの誤った振る舞いは深刻な結果をもたらす可能性がある。本稿では,タイムド・オートマトンとして与えられる安全特性からタイムド・シールドを合成する方法を示す。時間付きシールドは、可能な限りシステムに干渉しながら、ランニングシステムの安全性を強制する。時間付きプレシールドと時間付きプレシールドを提示する。タイムドプレシールドはシステムの前に置かれ、安全な出力のセットを提供する。このセットはシステムの選択を制限する。タイムドポストシールドはシステム後に実装される。システムを監視し、必要に応じてのみシステムの出力を補正する。さらに、タイムドポストシールド構造を拡張して、リカバリフェーズ、すなわち、仕様違反からシステムへの完全な制御が返される時点までの時間を保証する。実験結果では, 車両小隊制御のための強化学習環境において, 小隊の学習・実行段階における安全を確保するために, 時間付きポストシールドを用い, その効果について検討した。

関連論文リスト

Efficient Dynamic Shielding for Parametric Safety Specifications [2.1829548755022423]
Shieldingは、安全を損なう可能性がある場合、AIコントローラの動作を監視し、介入する必要があるランタイム安全執行ツールである。パラメトリック安全仕様の動的シールドを導入し,実行時に発生する可能性のあるすべての安全仕様の集合を簡潔に表現する。実験では、動的シールドはオフライン設計に数分かかり、各ステップでオンライン適応するのに1秒から数秒かかりましたが、ブルートフォースのオンライン再計算アプローチは最大5倍遅くなりました。
論文参考訳（メタデータ） (2025-05-28T08:30:03Z)
LIAR: Leveraging Inference Time Alignment (Best-of-N) to Jailbreak LLMs in Seconds [98.20826635707341]
ジェイルブレイク攻撃は、慎重に製作されたプロンプトを通じて有害なアウトプットを引き出すことによって、安全に整合したLDMの脆弱性を露呈する。私たちはジェイルブレイクを推論時のミスアライメントとして捉え、高速でブラックボックスのベスト・オブ・N$サンプリングアタックであるLIARを導入しました。また、安全アライメント強度を定量化し、最適下界を導出するための理論的「ジェイルブレイクに対する安全ネット」指標も導入する。
論文参考訳（メタデータ） (2024-12-06T18:02:59Z)
Compositional Shielding and Reinforcement Learning for Multi-Agent Systems [1.124958340749622]
高度な強化学習は、高性能なポリシーを得るための強力なツールとして登場した。安全を保証するための有望なパラダイムの1つは、安全でない行動からポリシーを守るシールドである。本研究では,マルチエージェント遮蔽のための新しい手法を提案する。
論文参考訳（メタデータ） (2024-10-14T12:52:48Z)
Synthesizing Efficient and Permissive Programmatic Runtime Shields for Neural Policies [7.831197018945118]
ニューラルポリシーのための軽量でパーミッシブなプログラム型ランタイムシールドを合成する新しいフレームワークを提案する。 Aegisは、スケッチベースのプログラム合成問題としてランタイムシールドの探索を定式化することでこれを達成している。現在の最先端と比較すると、イージスのシールドは時間オーバーヘッドの2.1$times$とメモリ使用量の4.4$times$である。
論文参考訳（メタデータ） (2024-10-08T02:44:55Z)
Shielded Reinforcement Learning for Hybrid Systems [1.0485739694839669]
強化学習は、ほぼ最適に近いコントローラを構築するために利用されてきたが、それらの動作は安全であると保証されていない。学習したコントローラーに安全を課す方法の1つは、設計によって正しいシールドを使用することである。本研究では,いわゆる野蛮な手法によるシールドの構築を提案し,基礎となるパーティションベースの2プレーヤ安全ゲームの近似有限表現を抽出する。
論文参考訳（メタデータ） (2023-08-28T09:04:52Z)
Safety Shielding under Delayed Observation [59.86192283565134]
シールドは安全な実行を保証するコンストラクション・バイ・コンストラクション・インストラクタである。シールドは、将来の干渉が最小化される可能性が最も高い方法で、安全な修正行動を選択するべきである。現実的な運転シミュレータにおけるシールドの最初の統合について述べる。
論文参考訳（メタデータ） (2023-07-05T10:06:10Z)
Approximate Shielding of Atari Agents for Safe Exploration [83.55437924143615]
遮蔽の概念に基づく安全な探索のための原理的アルゴリズムを提案する。本稿では,我々の近似遮蔽アルゴリズムが安全違反率を効果的に低減することを示す予備的な結果を示す。
論文参考訳（メタデータ） (2023-04-21T16:19:54Z)
Forecasting Particle Accelerator Interruptions Using Logistic LASSO Regression [62.997667081978825]
インターロックと呼ばれる予期せぬ粒子加速器の割り込みは、必要な安全対策にもかかわらず、突然の運用変更を引き起こす。このような中断を予測することを目的とした,単純かつ強力なバイナリ分類モデルを提案する。このモデルは、少なくとも絶対収縮と選択演算子によって罰せられるロジスティック回帰として定式化される。
論文参考訳（メタデータ） (2023-03-15T23:11:30Z)
Online Shielding for Reinforcement Learning [59.86192283565134]
RLエージェントのオンライン安全保護のためのアプローチを提案する。実行中、シールドは利用可能な各アクションの安全性を分析する。この確率と与えられた閾値に基づいて、シールドはエージェントからのアクションをブロックするかを決定する。
論文参考訳（メタデータ） (2022-12-04T16:00:29Z)
Sample-Efficient Safety Assurances using Conformal Prediction [57.92013073974406]
早期警戒システムは、安全でない状況が差し迫ったときに警告を提供することができる。安全性を確実に向上させるためには、これらの警告システムは証明可能な偽陰性率を持つべきである。本稿では,共形予測と呼ばれる統計的推論手法とロボット・環境力学シミュレータを組み合わせたフレームワークを提案する。
論文参考訳（メタデータ） (2021-09-28T23:00:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。