論文の概要: Efficient Dynamic Shielding for Parametric Safety Specifications
- arxiv url: http://arxiv.org/abs/2505.22104v1
- Date: Wed, 28 May 2025 08:30:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.497185
- Title: Efficient Dynamic Shielding for Parametric Safety Specifications
- Title(参考訳): パラメトリック安全仕様のための効率的な動的遮蔽
- Authors: Davide Corsi, Kaushik Mallik, Andoni Rodriguez, Cesar Sanchez,
- Abstract要約: Shieldingは、安全を損なう可能性がある場合、AIコントローラの動作を監視し、介入する必要があるランタイム安全執行ツールである。
パラメトリック安全仕様の動的シールドを導入し,実行時に発生する可能性のあるすべての安全仕様の集合を簡潔に表現する。
実験では、動的シールドはオフライン設計に数分かかり、各ステップでオンライン適応するのに1秒から数秒かかりましたが、ブルートフォースのオンライン再計算アプローチは最大5倍遅くなりました。
- 参考スコア(独自算出の注目度): 2.1829548755022423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Shielding has emerged as a promising approach for ensuring safety of AI-controlled autonomous systems. The algorithmic goal is to compute a shield, which is a runtime safety enforcement tool that needs to monitor and intervene the AI controller's actions if safety could be compromised otherwise. Traditional shields are designed statically for a specific safety requirement. Therefore, if the safety requirement changes at runtime due to changing operating conditions, the shield needs to be recomputed from scratch, causing delays that could be fatal. We introduce dynamic shields for parametric safety specifications, which are succinctly represented sets of all possible safety specifications that may be encountered at runtime. Our dynamic shields are statically designed for a given safety parameter set, and are able to dynamically adapt as the true safety specification (permissible by the parameters) is revealed at runtime. The main algorithmic novelty lies in the dynamic adaptation procedure, which is a simple and fast algorithm that utilizes known features of standard safety shields, like maximal permissiveness. We report experimental results for a robot navigation problem in unknown territories, where the safety specification evolves as new obstacles are discovered at runtime. In our experiments, the dynamic shields took a few minutes for their offline design, and took between a fraction of a second and a few seconds for online adaptation at each step, whereas the brute-force online recomputation approach was up to 5 times slower.
- Abstract(参考訳): シールドは、AI制御された自律システムの安全性を確保するための有望なアプローチとして登場した。
アルゴリズムの目標は、安全が損なわれる可能性がある場合、AIコントローラの動作を監視し、介入する必要があるランタイム安全執行ツールであるシールドを計算することである。
従来のシールドは、特定の安全要件のために静的に設計されている。
したがって、動作条件の変更により実行時に安全要件が変更される場合、シールドをスクラッチから再計算する必要があるため、致命的な遅延が発生する可能性がある。
パラメトリック安全仕様の動的シールドを導入し,実行時に発生する可能性のあるすべての安全仕様の集合を簡潔に表現する。
我々の動的シールドは、与えられた安全パラメータセットのために静的に設計されており、実行時に真の安全仕様(パラメータによって許容される)が明らかにされるように動的に適応することができる。
アルゴリズムの主な特徴は動的適応法であり、最大許容性のような標準安全シールドの既知の特徴を利用する単純で高速なアルゴリズムである。
未知領域におけるロボットナビゲーション問題に対して,実行時に新たな障害が発見されるにつれて,安全仕様が進化する実験結果について報告する。
実験では、動的シールドはオフライン設計に数分かかり、各ステップでオンライン適応するのに1秒から数秒かかりましたが、ブルートフォースのオンライン再計算アプローチは最大5倍遅くなりました。
関連論文リスト
- Shape it Up! Restoring LLM Safety during Finetuning [66.46166656543761]
大型言語モデル(LLM)の微調整は、ユーザ固有のカスタマイズを可能にするが、重大な安全性リスクをもたらす。
動的安全整形(DSS)は,不安全コンテンツを抑えつつ,応答の安全な部分からの学習を強化するための,きめ細かい安全信号を用いたフレームワークである。
STARスコアによって導かれるSTAR-DSSは、微調整リスクを堅牢に軽減し、多様な脅威、データセット、モデルファミリーにまたがる大幅な安全性の向上を提供する。
論文 参考訳(メタデータ) (2025-05-22T18:05:16Z) - One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments [10.103090762559708]
観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。
我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。
提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
論文 参考訳(メタデータ) (2024-12-13T09:21:02Z) - Compositional Shielding and Reinforcement Learning for Multi-Agent Systems [1.124958340749622]
高度な強化学習は、高性能なポリシーを得るための強力なツールとして登場した。
安全を保証するための有望なパラダイムの1つは、安全でない行動からポリシーを守るシールドである。
本研究では,マルチエージェント遮蔽のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-14T12:52:48Z) - Realizable Continuous-Space Shields for Safe Reinforcement Learning [13.728961635717134]
本研究では、連続状態および行動空間における安全要件の満足度を確保するために特別に設計された最初の遮蔽手法を提案する。
我々の手法は実現可能性の上に構築されており、シールドが環境中のあらゆる状態に対して常に安全なアクションを発生させることができることを確認する重要な特性である。
論文 参考訳(メタデータ) (2024-10-02T21:08:11Z) - Safety through Permissibility: Shield Construction for Fast and Safe Reinforcement Learning [57.84059344739159]
シールドディング」は、強化学習(RL)の安全性を強制する一般的な手法である
安全と遮蔽構造に対処する新しい許容性に基づく枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T18:00:21Z) - Safety Shielding under Delayed Observation [59.86192283565134]
シールドは安全な実行を保証するコンストラクション・バイ・コンストラクション・インストラクタである。
シールドは、将来の干渉が最小化される可能性が最も高い方法で、安全な修正行動を選択するべきである。
現実的な運転シミュレータにおけるシールドの最初の統合について述べる。
論文 参考訳(メタデータ) (2023-07-05T10:06:10Z) - Approximate Shielding of Atari Agents for Safe Exploration [83.55437924143615]
遮蔽の概念に基づく安全な探索のための原理的アルゴリズムを提案する。
本稿では,我々の近似遮蔽アルゴリズムが安全違反率を効果的に低減することを示す予備的な結果を示す。
論文 参考訳(メタデータ) (2023-04-21T16:19:54Z) - Online Shielding for Reinforcement Learning [59.86192283565134]
RLエージェントのオンライン安全保護のためのアプローチを提案する。
実行中、シールドは利用可能な各アクションの安全性を分析する。
この確率と与えられた閾値に基づいて、シールドはエージェントからのアクションをブロックするかを決定する。
論文 参考訳(メタデータ) (2022-12-04T16:00:29Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。