論文の概要: Any-Body Guard: Universal Safeguarding for Manipulation Policies via Action Masking
- arxiv url: http://arxiv.org/abs/2606.22278v1
- Date: Sun, 21 Jun 2026 00:11:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 19:25:09.84927
- Title: Any-Body Guard: Universal Safeguarding for Manipulation Policies via Action Masking
- Title(参考訳): Any-Body Guard: アクションマスキングによる操作ポリシーの普遍的保護
- Authors: Alex Beaudin, Hanna Krasowski, Kartik Nagpal, Sanjit A. Seshia, Murat Arcak, Negar Mehr,
- Abstract要約: 本稿では,衝突回避のための公式な確率的保証を提供するため,ロボットの構成空間内で直接的にX-Safeを提案する。
X-Safeは、追加データや異なる実施形態やシーンのエンジニアリング作業を必要とせずに、有効な公式な安全保証を提供する。
現状の安全対策に比べてタスクパフォーマンスの劣化は少なく、ハードウェア実験では衝突がなく、正式な保証を実証的に裏付ける。
- 参考スコア(独自算出の注目度): 8.631897701126869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring safety of learning-enabled robotic manipulation across diverse embodiments and tasks still requires significant manual engineering. Existing approaches typically rely on heuristically designed fallback controllers or complex forward invariance assessments. These methods are often too conservative for task success, too computationally expensive for real-time execution, too heuristic to provide useful safety guarantees, or too engineering-heavy to transfer between setups. In this paper, we propose a universal safeguarding approach, X-Safe, which reasons directly in the robot's configuration space to provide formal probabilistic guarantees for collision avoidance. By operating in the configuration space, our method transfers across embodiments while relying solely on an object-based, quasi-static scene representation and a forward kinematics model of the robotic manipulator. Thus, X-Safe provides useful formal safety guarantees without requiring additional data, or engineering effort for different embodiments or scenes. We demonstrate X-Safe for diverse embodiments and policies, both in simulation and on hardware. We observe less degradation in task performance compared to state-of-the-art safeguarding, no collisions on hardware experiments, and empirically corroborate our formal guarantees.
- Abstract(参考訳): 多様な実施形態やタスクにまたがって学習可能なロボット操作の安全性を確保するには、依然としてかなりの手動技術が必要である。
既存のアプローチは通常、ヒューリスティックに設計されたフォールバックコントローラや複雑な前方不変性評価に依存している。
これらの手法はタスクの成功には保守的すぎる場合が多く、リアルタイム実行には計算コストがかかりすぎる場合もあれば、安全な安全保証を提供するにはヒューリスティックすぎる場合もあれば、セットアップ間での移動にはエンジニアリングが多すぎる場合も少なくない。
本稿では,衝突回避のための公式な確率的保証を提供するために,ロボットの構成空間内で直接的に原因となる,普遍的な安全確保手法であるX-Safeを提案する。
構成空間内での操作により,ロボットマニピュレータの擬似静的シーン表現と前方運動学モデルにのみ依存しながら,エボディメント間を移動させる。
したがって、X-Safeは、追加のデータや異なる実施形態やシーンのエンジニアリング作業を必要とせずに、有用な公式な安全保証を提供する。
我々は、シミュレーションとハードウェアの両方において、多様な実施形態とポリシーに対してX-Safeを実証する。
現状の安全対策に比べてタスクパフォーマンスの劣化は少なく、ハードウェア実験では衝突がなく、正式な保証を実証的に裏付ける。
関連論文リスト
- BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Q-realign: Piggybacking Realignment on Quantization for Safe and Efficient LLM Deployment [55.14890249389052]
既存の防衛は、安全回復を微調整に埋め込んだり、微調整による修正に先立って微調整に頼ったりしている。
我々は,ポストトレーニング量子化に基づくポストホック防御手法であるtextttQ-realign を提案する。
私たちの仕事は、安全を意識したデプロイメントのための実践的でターンキーなソリューションを提供します。
論文 参考訳(メタデータ) (2026-01-13T00:07:24Z) - RoboSafe: Safeguarding Embodied Agents via Executable Safety Logic [56.38397499463889]
視覚言語モデル(VLM)を利用するエージェントは、複雑な現実世界のタスクを実行する能力がますます高まっている。
しかし、安全でない行動を引き起こす可能性のある危険な指示に弱いままである。
提案するRoboSafeは,実行可能述語ベースの安全ロジックを通じて,エージェントを具体化するためのランタイムセーフガードである。
論文 参考訳(メタデータ) (2025-12-24T15:01:26Z) - Predictive Safety Shield for Dyna-Q Reinforcement Learning [0.0]
離散空間におけるモデルに基づく強化学習エージェントの予測安全シールドを提案する。
我々の安全シールドは、環境モデルの安全なシミュレーションから生じる安全な予測に基づいて、Q関数を局所的に更新する。
グリッドワールド環境に関する我々の実験は、たとえ短い予測地平線であっても最適な経路を特定するのに十分であることを示した。
論文 参考訳(メタデータ) (2025-11-26T15:59:55Z) - Towards provable probabilistic safety for scalable embodied AI systems [79.31011047593492]
エンボディードAIシステムは、様々なアプリケーションでますます普及している。
複雑な運用環境での安全性確保は依然として大きな課題である。
このパースペクティブは、安全で大規模に実施されたAIシステムを安全クリティカルなアプリケーションに採用するための道筋を提供する。
論文 参考訳(メタデータ) (2025-06-05T15:46:25Z) - Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - ISAACS: Iterative Soft Adversarial Actor-Critic for Safety [0.9217021281095907]
この研究は、ロボットシステムのための堅牢な安全維持コントローラのスケーラブルな合成を可能にする新しいアプローチを導入する。
安全を追求するフォールバックポリシーは、モデルエラーの最悪のケースの実現を促進するために、敵の「混乱」エージェントと共同で訓練される。
学習した制御ポリシーは本質的に安全性を保証するものではないが、リアルタイムの安全フィルタを構築するために使用される。
論文 参考訳(メタデータ) (2022-12-06T18:53:34Z) - An Empirical Analysis of the Use of Real-Time Reachability for the
Safety Assurance of Autonomous Vehicles [7.1169864450668845]
本稿では,1/10スケールのオープンソース自動運転車プラットフォームの安全性を確保するために,シンプルなアーキテクチャの実装にリアルタイムリーチビリティアルゴリズムを提案する。
提案手法では,システムの将来状態に対するコントローラの判断の影響に着目して,基盤となるコントローラを解析する必要性を抽象化する。
論文 参考訳(メタデータ) (2022-05-03T11:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。