論文の概要: Learning Safe-Stoppability Monitors for Humanoid Robots
- arxiv url: http://arxiv.org/abs/2603.22703v1
- Date: Tue, 24 Mar 2026 01:51:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.24152
- Title: Learning Safe-Stoppability Monitors for Humanoid Robots
- Title(参考訳): ヒューマノイドロボットの安全安定度モニターの学習
- Authors: Yifan Sun, Yiyuan Pan, Shangtao Li, Caiwu Ding, Tao Cui, Lingyun Wang, Changliu Liu,
- Abstract要約: 我々は,ヒューマノイドの緊急停止を政策依存型安全性問題として定式化する。
我々はPRISMを紹介した。PRISMはシミュレーション駆動のフレームワークで、状態レベルのストッパビリティのための神経予測器を学習する。
以上の結果から,政策依存的停止性としての安全性のモデル化により,積極的な安全監視が可能であり,ヒューマノイドロボットのフェールセーフ動作のスケーラブルな認証を支援することが示唆された。
- 参考スコア(独自算出の注目度): 11.850318870435265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emergency stop (E-stop) mechanisms are the de facto standard for robot safety. However, for humanoid robots, abruptly cutting power can itself cause catastrophic failures; instead, an emergency stop must execute a predefined fallback controller that preserves balance and drives the robot toward a minimum-risk condition. This raises a critical question: from which states can a humanoid robot safely execute such a stop? In this work, we formalize emergency stopping for humanoids as a policy-dependent safe-stoppability problem and use data-driven approaches to characterize the safe-stoppable envelope. We introduce PRISM (Proactive Refinement of Importance-sampled Stoppability Monitor), a simulation-driven framework that learns a neural predictor for state-level stoppability. PRISM iteratively refines the decision boundary using importance sampling, enabling targeted exploration of rare but safety-critical states. This targeted exploration significantly improves data efficiency while reducing false-safe predictions under a fixed simulation budget. We further demonstrate sim-to-real transfer by deploying the pretrained monitor on a real humanoid platform. Results show that modeling safety as policy-dependent stoppability enables proactive safety monitoring and supports scalable certification of fail-safe behaviors for humanoid robots.
- Abstract(参考訳): 緊急停止(E-stop)メカニズムは、ロボットの安全性のデファクトスタンダードである。
しかし、ヒューマノイドロボットにとって、突然の切断力は破滅的な失敗を引き起こす可能性がある。代わりに、緊急停止はバランスを保ち、ロボットを最小リスク状態へと駆動する予め定義されたフォールバックコントローラを実行する必要がある。
このことは、人間型ロボットがそのような停止を安全に実行できる状態から、重要な疑問を提起する。
本研究では,ヒューマノイドの緊急停止を政策依存型セーフ・ストッパビリティ問題として定式化し,データ駆動型アプローチを用いて安全・ストッパブルエンベロープを特徴づける。
PRISM(Proactive Refinement of Importance-sampled Stoppability Monitor)は、状態レベルのストッパビリティのための神経予測器を学習するシミュレーション駆動のフレームワークである。
PRISMは、重要サンプリングを使用して意思決定境界を反復的に洗練し、希少だが安全クリティカルな状態の探索を可能にする。
このターゲット探索は、固定されたシミュレーション予算下での偽安全予測を低減しつつ、データ効率を大幅に改善する。
さらに,実際のヒューマノイドプラットフォーム上に事前学習したモニタを配置することで,シミュレート・トゥ・リアル・トランスファーを実証する。
以上の結果から,政策依存的停止性としての安全性のモデル化により,積極的な安全監視が可能であり,ヒューマノイドロボットのフェールセーフ動作のスケーラブルな認証を支援することが示唆された。
関連論文リスト
- RoboSafe: Safeguarding Embodied Agents via Executable Safety Logic [56.38397499463889]
視覚言語モデル(VLM)を利用するエージェントは、複雑な現実世界のタスクを実行する能力がますます高まっている。
しかし、安全でない行動を引き起こす可能性のある危険な指示に弱いままである。
提案するRoboSafeは,実行可能述語ベースの安全ロジックを通じて,エージェントを具体化するためのランタイムセーフガードである。
論文 参考訳(メタデータ) (2025-12-24T15:01:26Z) - From Refusal to Recovery: A Control-Theoretic Approach to Generative AI Guardrails [12.84192844049763]
ほとんどのAIガードレールは、ラベル付きデータセットと人間の特定基準に基づいた出力分類に依存している。
私たちはAIシステムのアウトプットをリアルタイムで監視し、安全なアウトプットに対して積極的に修正する予測ガードレールを構築します。
シミュレーション運転とeコマース設定の実験では、制御理論のガードレールが破滅的な結果を確実に排除できることを示した。
論文 参考訳(メタデータ) (2025-10-15T16:30:57Z) - ANNIE: Be Careful of Your Robots [48.89876809734855]
エンボディドAIシステムに対する敵の安全攻撃に関する最初の体系的研究について述べる。
すべての安全カテゴリーで攻撃の成功率は50%を超えている。
結果は、実証済みのAIシステムにおいて、これまで未調査だったが、非常に連続的な攻撃面を露呈する。
論文 参考訳(メタデータ) (2025-09-03T15:00:28Z) - Uncertainty Aware-Predictive Control Barrier Functions: Safer Human Robot Interaction through Probabilistic Motion Forecasting [13.020006323600251]
不確かさを意識した予測制御バリア関数は、制御バリア関数の正式な安全性を保証することで、確率的手の動き予測を融合させる。
UA-PCBFは、将来の人間の状態をより深く理解した協力型ロボットに力を与える。
最先端のHRIアーキテクチャとは対照的に、UA-PCBFはタスククリティカルなメトリクスでより良いパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-08-28T14:11:26Z) - Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.267574471145217]
Hamilton-Jacobi (H) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。
生観測データを直接操作する潜在空間到達性であるLa Safety Filtersを提案する。
論文 参考訳(メタデータ) (2025-02-02T22:00:20Z) - Ensuring Force Safety in Vision-Guided Robotic Manipulation via Implicit Tactile Calibration [18.183151257773886]
本稿ではSafeDiffと呼ばれる新しい状態拡散フレームワークを紹介する。
これにより、現在のロボットの状態と視覚的コンテキスト観察から予測状態列を生成する。
リアルタイムの触覚フィードバックを組み込んでシーケンスを洗練させる。
実験では, 視覚触覚モデルにより, ドア開口部の有害な力の危険性が著しく軽減された。
論文 参考訳(メタデータ) (2024-12-13T18:45:26Z) - ABNet: Attention BarrierNet for Safe and Scalable Robot Learning [58.4951884593569]
バリアベースの手法は、安全なロボット学習における主要なアプローチの1つである。
本稿では,より大規模な基本安全モデルを段階的に構築するスケーラブルなAttention BarrierNet(ABNet)を提案する。
2次元ロボット障害物回避、安全なロボット操作、視覚に基づくエンドツーエンド自動運転におけるABNetの強みを実証する。
論文 参考訳(メタデータ) (2024-06-18T19:37:44Z) - Safety Margins for Reinforcement Learning [53.10194953873209]
安全マージンを生成するためにプロキシ臨界度メトリクスをどのように活用するかを示す。
Atari 環境での APE-X と A3C からの学習方針に対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-07-25T16:49:54Z) - SHARP: Shielding-Aware Robust Planning for Safe and Efficient
Human-Robot Interaction [5.804727815849655]
シールド」制御スキームは、安全クリティカルなイベントが差し迫った場合に、ロボットの名目上の計画と安全フォールバック戦略をオーバーライドする。
本研究では,ロボットが将来の遮蔽イベントを明示的に考慮し,効率的に計画できる新しい遮蔽型計画手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T17:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。