論文の概要: Adversarial Stress Testing of SPARK Humanoid Safety Filters
- arxiv url: http://arxiv.org/abs/2605.19009v1
- Date: Mon, 18 May 2026 18:32:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.919537
- Title: Adversarial Stress Testing of SPARK Humanoid Safety Filters
- Title(参考訳): SPARKヒューマノイド安全フィルタの逆応力試験
- Authors: Saurav Ghosh, Abdou Sow, Luke Zhang,
- Abstract要約: 本研究では,SPARKヒューマノイド安全フィルタの再現性および応力試験によるロバスト性について検討した。
以上の結果から,目標をより緊密に追跡する手法もあれば,衝突手順をより効率的に行う方法もある。
ストレステストにより,障害物群集,騒音距離推定,遅延障害物情報の下での安全行動が変化することが示唆された。
- 参考スコア(独自算出の注目度): 1.159751616011475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humanoid robots are difficult to deploy safely because they have high-dimensional bodies, many collision constraints, and must operate near people and obstacles. Safety filters help by modifying a nominal control action when it may violate collision-avoidance constraints. Still, nominal benchmark scores do not fully show how these filters behave in harder environments. In this work, we study the robustness of SPARK humanoid safety filters through replication and stress testing. We replicate the SPARK benchmark case G1SportMode_D1_WG_SO_v1 in MuJoCo and evaluate RSSA, RSSS, SSA, CBF, PFM, and SMA under controlled random seeds. We also built a post-processing pipeline that converts raw SPARK logs into goal-tracking, minimum-distance, and collision-step metrics. Our results show that some methods track the goal more closely, while others reduce collision steps more effectively. The stress tests further indicate that safety behavior can change under obstacle crowding, noisy distance estimates, and delayed obstacle information. These findings suggest that humanoid autonomy should be evaluated beyond nominal performance, using metrics that expose failure modes before deployment.
- Abstract(参考訳): ヒューマノイドロボットは、高次元体、多くの衝突制約があり、人や障害物の近くで動作しなければならないため、安全に展開することは困難である。
安全フィルタは、衝突回避制約に違反した場合に、名目上の制御動作を変更するのに役立つ。
それでも、名目上のベンチマークスコアは、これらのフィルターがより厳しい環境でどのように振る舞うかを十分に示していない。
本研究では,SPARKヒューマノイド安全フィルタの再現性と応力試験によるロバスト性について検討する。
我々は、MuJoCoのSPARKベンチマークケースG1SportMode_D1_WG_SO_v1を再現し、制御されたランダムシードの下でRSSA、RSSS、SSA、CBF、PFM、SMAを評価する。
また、生のSPARKログをゴールトラッキング、最小距離、衝突ステップのメトリクスに変換する後処理パイプラインを構築しました。
以上の結果から,目標をより緊密に追跡する手法もあれば,衝突手順をより効率的に行う方法もある。
ストレステストにより,障害物群集,騒音距離推定,遅延障害物情報の下での安全行動が変化することが示唆された。
これらの結果は、ヒューマノイドの自律性は、デプロイメント前に障害モードを公開するメトリクスを使用して、名目上のパフォーマンスを超えて評価されるべきであることを示唆している。
関連論文リスト
- Selective Safety Steering via Value-Filtered Decoding [54.87935112120107]
大型言語モデル(LLM)は人間の価値観に合わせるように訓練されているが、その世代は安全上の制約に反する可能性がある。
既存のデコード時のステアリング手法は、しばしば不要に介入し、ベースモデルの下で安全であった世代を変更する。
安全でない応答の安全性を向上しつつ、そのような不要な介入を減らすための新しいテストタイムステアリング手法を提案する。
論文 参考訳(メタデータ) (2026-05-14T12:13:08Z) - CMP: Robust Whole-Body Tracking for Loco-Manipulation via Competence Manifold Projection [64.65196237023754]
Manifold Competence Projectionは、アウト・オブ・ディストリビューションの摂動に対する堅牢性を改善する。
我々は、無限水平安全制約を計算効率の良い単段多様体包含に変換するフレーム-ワイズ安全スキームを用いる。
実験により、CMPは典型的なOODシナリオで最大10倍の生存率向上を達成することが示された。
論文 参考訳(メタデータ) (2026-04-08T18:00:39Z) - Layered Safety: Enhancing Autonomous Collision Avoidance via Multistage CBF Safety Filters [18.386652442201665]
本稿では,ロバストで信頼性の高い層状安全フィルタを構築するための汎用的なエンドツーエンドフレームワークを提案する。
ロボット中心の点雲が与えられた場合、我々は、ポアソン安全関数(PSF)を合成するために使用される占有マップを構築することから始める。
PSFは2つの異なる安全濾過段階において制御バリア機能(CBF)として使用される。
論文 参考訳(メタデータ) (2026-02-27T22:19:45Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Impact-Robust Posture Optimization for Aerial Manipulation [21.57320550387136]
本稿では,衝撃時のロバスト性を改善するために,運動学的に冗長なトルク制御ロボットの姿勢を最適化する新しい手法を提案する。
厳密な衝撃モデル(英語版)は、前衝突速度と後衝突速度の変動を定量化する構成依存計量の基礎として用いられる。
本手法は,ロボット構成における衝撃後スパイクの最大51%(標準TSID)の低減と,アクチュエータ飽和の回避に成功している。
論文 参考訳(メタデータ) (2026-02-14T13:16:46Z) - SQ-CBF: Signed Distance Functions for Numerically Stable Superquadric-Based Safety Filtering [9.291918812545699]
制御バリア関数は、リアルタイムな安全フィルタリングのための効果的なフレームワークを提供する。
それらの性能は下層の幾何学的表現に依存し、しばしば単純化される。
スーパークワッドリックは、いくつかのプリミティブを使って複雑な形状をモデル化する表現力のある方法を提供する。
論文 参考訳(メタデータ) (2026-02-11T17:19:43Z) - Building a Foundational Guardrail for General Agentic Systems via Synthetic Data [76.18834864749606]
LLMエージェントは、計画段階で介入するマルチステップタスクを計画できる。
既存のガードレールは主にポスト・エグゼクティブ(英語版)を運用しており、スケーリングが困難であり、計画レベルで制御可能な監督を行う余地がほとんどない。
我々は、良性軌道を合成し、カテゴリーラベル付きリスクを困難に注入し、自動報酬モデルを介して出力をフィルタリングする制御可能なエンジンであるAuraGenを紹介する。
論文 参考訳(メタデータ) (2025-10-10T18:42:32Z) - Constrained Decoding for Robotics Foundation Models [12.916330118607918]
本稿では,自動回帰ロボット基盤モデルのための制約付き復号化フレームワークであるSafeDecを紹介する。
タスク固有の安全ルールはSignal Temporal Logic (STL) 公式として表現され、最小限のオーバーヘッドで推論時に強制される。
提案手法は,実行時に仮定された動的条件下でのSTL仕様を,再トレーニングなしで確実に満たすものである。
論文 参考訳(メタデータ) (2025-09-01T19:17:40Z) - Uniformly Safe RL with Objective Suppression for Multi-Constraint Safety-Critical Applications [73.58451824894568]
広く採用されているCMDPモデルは予測のリスクを制約しており、長い尾の州で危険な行動を起こす余地がある。
安全クリティカルな領域では、そのような行動は破滅的な結果をもたらす可能性がある。
本稿では,目標を最大化するタスク報酬を適応的に抑制する新しい手法であるObjective Suppressionを提案する。
論文 参考訳(メタデータ) (2024-02-23T23:22:06Z) - Multi-Step Model Predictive Safety Filters: Reducing Chattering by
Increasing the Prediction Horizon [7.55113002732746]
安全フィルタを用いて学習制御ポリシを増強することにより、状態と入力制約の満足度を保証できる。
モデル予測安全フィルタ(MPSF)は、モデル予測制御(MPC)に基づく一般的な安全フィルタリング手法である。
論文 参考訳(メタデータ) (2023-09-20T16:35:29Z) - A Multiplicative Value Function for Safe and Efficient Reinforcement
Learning [131.96501469927733]
本稿では,安全評論家と報酬評論家からなる新しい乗法値関数を持つモデルフリーRLアルゴリズムを提案する。
安全評論家は、制約違反の確率を予測し、制限のないリターンのみを見積もる報酬批評家を割引する。
安全制約を付加した古典的RLベンチマークや、画像を用いたロボットナビゲーションタスク、生のライダースキャンを観察する4つの環境において、本手法の評価を行った。
論文 参考訳(メタデータ) (2023-03-07T18:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。