論文の概要: Shields to Guarantee Probabilistic Safety in MDPs
- arxiv url: http://arxiv.org/abs/2605.10888v2
- Date: Wed, 13 May 2026 15:09:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 17:13:58.866229
- Title: Shields to Guarantee Probabilistic Safety in MDPs
- Title(参考訳): 自民党の安全確保のためのシールド
- Authors: Linus Heck, Filip Macák, Roman Andriushchenko, Milan Češka, Sebastian Junges,
- Abstract要約: 本稿では,古典的シールドを確率論的安全性に保守的に拡張する形式的枠組みを提案する。
本枠組みでは,安全性と許容性に関する強い保証を維持することの不可能性を実証し,(ii)より弱い保証を備えた自然シールドを提供し,(iii)強力な安全保証を確保するためのオフラインおよびオンラインシールド構築を導入する。
- 参考スコア(独自算出の注目度): 3.788847276402066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shielding is a prominent model-based technique to ensure safety of autonomous agents. Classical shielding aims to ensure that nothing bad ever happens and comes with strong guarantees about safety and maximal permissiveness. However, shielding systems for probabilistic safety, where something bad is allowed to happen with an acceptable probability, has proven to be more intricate. This paper presents a formal framework that conservatively extends classical shields to probabilistic safety. In this framework, we (i) demonstrate the impossibility of preserving the strong guarantees on safety and permissiveness, (ii) provide natural shields with weaker guarantees, and (iii) introduce offline and online shield constructions ensuring strong safety guarantees. The empirical evaluation highlights the practical advantages of the new shields, as well as their computational feasibility.
- Abstract(参考訳): シールドは、自律エージェントの安全性を確保するための、卓越したモデルベースのテクニックである。
古典的な遮蔽は、何も悪いことは起こらないことを保証することを目的としており、安全と最大限の寛容性について強い保証が与えられている。
しかし、悪いことが許容可能な確率で起こる確率論的安全のための遮蔽システムは、より複雑であることが証明されている。
本稿では,古典的シールドを確率論的安全性に保守的に拡張する形式的枠組みを提案する。
この枠組みでは
一 安全及び寛容性の強い保証を維持することの不可能さを示すこと。
(二)より保証の弱い天然の盾を提供すること、
三 オフライン及びオンラインシールド工事を導入し、安全性の確保を図ること。
実験的な評価は、新しいシールドの実用的利点と、その計算可能性を強調している。
関連論文リスト
- Robust Probabilistic Shielding for Safe Offline Reinforcement Learning [12.352902259774345]
オフラインの強化学習では、環境相互作用のない固定データセットからポリシーを学習する。
安全なポリシー改善(SPI)と呼ばれる技術は、パフォーマンスを保証する: 高い確率で、新しいポリシーは与えられた基本方針よりも優れ、安全であると仮定される。
シールドをオフラインのRLに拡張し、利用可能なデータセットと安全でない状態の知識にのみ依存することで、これらのパラダイムを統合する。
論文 参考訳(メタデータ) (2026-05-11T09:54:30Z) - Predictive Safety Shield for Dyna-Q Reinforcement Learning [0.0]
離散空間におけるモデルに基づく強化学習エージェントの予測安全シールドを提案する。
我々の安全シールドは、環境モデルの安全なシミュレーションから生じる安全な予測に基づいて、Q関数を局所的に更新する。
グリッドワールド環境に関する我々の実験は、たとえ短い予測地平線であっても最適な経路を特定するのに十分であることを示した。
論文 参考訳(メタデータ) (2025-11-26T15:59:55Z) - SafeR-CLIP: Mitigating NSFW Content in Vision-Language Models While Preserving Pre-Trained Knowledge [51.634837361795434]
SaFeR-CLIPは安全性と性能を調整し、以前の方法に比べて最大8.0%のゼロショット精度を回復する。
NSFW-Capsは、分散シフト下での安全性をテストするために、1000の高度に整合したペアの新しいベンチマークである。
論文 参考訳(メタデータ) (2025-11-20T19:00:15Z) - ProSh: Probabilistic Shielding for Model-free Reinforcement Learning [11.125968799758434]
本稿では,コスト制約下での安全な強化学習のためのモデルフリーアルゴリズムであるProSh(Probabilistic Shielding via Risk Augmentation)を紹介する。
ProShは、学習したコスト批評家を使用してエージェントのポリシー分布にシールドを適用することで安全性を強制する。
環境が決定論的である場合には最適性が保たれることを示す。
論文 参考訳(メタデータ) (2025-10-17T15:08:51Z) - Towards provable probabilistic safety for scalable embodied AI systems [79.31011047593492]
エンボディードAIシステムは、様々なアプリケーションでますます普及している。
複雑な運用環境での安全性確保は依然として大きな課題である。
このパースペクティブは、安全で大規模に実施されたAIシステムを安全クリティカルなアプリケーションに採用するための道筋を提供する。
論文 参考訳(メタデータ) (2025-06-05T15:46:25Z) - Probabilistic Shielding for Safe Reinforcement Learning [51.35559820893218]
現実のシナリオでは、強化学習(RL)エージェントはトレーニング時間を含む安全な振る舞いをしなければならない。
我々は,Safe RLの厳密な保証を享受する,スケーラブルな新しい手法を提案する。
当社のアプローチは、トレーニングやテスト時にエージェントが安全であることを保証する厳格な公式な安全保証を提供する。
論文 参考訳(メタデータ) (2025-03-09T17:54:33Z) - Realizable Continuous-Space Shields for Safe Reinforcement Learning [13.728961635717134]
本研究では、連続状態および行動空間における安全要件の満足度を確保するために特別に設計された最初の遮蔽手法を提案する。
我々の手法は実現可能性の上に構築されており、シールドが環境中のあらゆる状態に対して常に安全なアクションを発生させることができることを確認する重要な特性である。
論文 参考訳(メタデータ) (2024-10-02T21:08:11Z) - Safety through Permissibility: Shield Construction for Fast and Safe Reinforcement Learning [57.84059344739159]
シールドディング」は、強化学習(RL)の安全性を強制する一般的な手法である
安全と遮蔽構造に対処する新しい許容性に基づく枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T18:00:21Z) - Leveraging Approximate Model-based Shielding for Probabilistic Safety
Guarantees in Continuous Environments [63.053364805943026]
近似モデルベースの遮蔽フレームワークを連続的な設定に拡張する。
特に、テストベッドとしてSafety Gymを使用し、一般的な制約付きRLアルゴリズムとABBSのより直接的な比較を可能にします。
論文 参考訳(メタデータ) (2024-02-01T17:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。