論文の概要: ROBOGATE: Adaptive Failure Discovery for Safe Robot Policy Deployment via Two-Stage Boundary-Focused Sampling
- arxiv url: http://arxiv.org/abs/2603.22126v2
- Date: Mon, 30 Mar 2026 06:37:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 18:41:08.429326
- Title: ROBOGATE: Adaptive Failure Discovery for Safe Robot Policy Deployment via Two-Stage Boundary-Focused Sampling
- Title(参考訳): ROBOGATE:二段階境界焦点サンプリングによる安全なロボットポリシー展開のための適応的障害発見
- Authors: Azuki Kim,
- Abstract要約: ROBOGATEは、物理に基づくシミュレーションと2段階適応サンプリング戦略を組み合わせたデプロイメントリスク管理フレームワークである。
我々は、Franka Panda (7-DOF) とUR5e (6-DOF) の2つのロボット体のスクリプトによるピック・アンド・プレイス・コントローラーの評価を行った。
我々のロジスティック回帰リスクモデルは、組み合わせたデータセットで0.780のAUCを達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying learned robot manipulation policies in industrial settings requires rigorous pre-deployment validation, yet exhaustive testing across high-dimensional parameter spaces is intractable. We present ROBOGATE, a deployment risk management framework that combines physics-based simulation with a two-stage adaptive sampling strategy to efficiently discover failure boundaries in the operational parameter space. Stage 1 employs Latin Hypercube Sampling (LHS) across an 8-dimensional parameter space to establish a coarse failure landscape from 20,000 uniformly distributed experiments. Stage 2 applies boundary-focused sampling that concentrates 10,000 additional experiments in the 30-70% success rate transition zone, enabling precise failure boundary mapping. Using NVIDIA Isaac Sim with Newton physics, we evaluate a scripted pick-and-place controller on two robot embodiments -- Franka Panda (7-DOF) and UR5e (6-DOF) -- across 30,000 total experiments. Our logistic regression risk model achieves an AUC of 0.780 on the combined dataset (vs. 0.754 for Stage 1 alone), identifies a closed-form failure boundary equation, and reveals four universal danger zones affecting both robot platforms. We further demonstrate the framework on VLA (Vision-Language-Action) model evaluation, where Octo-Small achieves 0.0% success rate on 68 adversarial scenarios versus 100% for the scripted baseline -- a 100-point gap that underscores the challenge of deploying foundation models in industrial settings. ROBOGATE is open-source and runs on a single GPU workstation.
- Abstract(参考訳): 産業環境で学習したロボット操作ポリシーをデプロイするには、厳密な事前デプロイの検証が必要であるが、高次元のパラメータ空間にわたる徹底的なテストは難解である。
本稿では,物理シミュレーションと2段階適応サンプリング戦略を組み合わせた配置リスク管理フレームワークROBOGATEについて述べる。
ステージ1では8次元のパラメータ空間にラテンハイパーキューブサンプリング(LHS)を用いて、20,000の均一分散実験から粗い障害環境を確立する。
ステージ2では、30~70%の成功率移行ゾーンで1万の実験を集中する境界中心のサンプリングを適用し、正確な障害境界マッピングを可能にします。
NVIDIAのIsaac SimとNewtonの物理学を用いて、合計3万の実験で、Franka Panda (7-DOF)とUR5e (6-DOF)の2つのロボットエボディメント上で、スクリプト化されたピック・アンド・プレイス・コントローラを評価した。
我々のロジスティック回帰リスクモデルは、組み合わせたデータセット上で0.780のAUC(ステージ1単独で0.754)を達成し、クローズドフォームの障害境界方程式を特定し、両方のロボットプラットフォームに影響を与える4つの普遍的危険ゾーンを明らかにする。
さらに、VLA(Vision-Language-Action)モデル評価のフレームワークを実証し、68のシナリオに対してOcto-Smallは0.0%の成功率、スクリプトベースラインでは100%を達成します。
ROBOGATEはオープンソースで、単一のGPUワークステーションで動作する。
関連論文リスト
- SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space [1.8763872698583384]
オフラインからオンラインへの強化学習(RL)は、安全でオフラインなデモに関するポリシーを事前訓練し、オンラインインタラクションを通じてそれらを微調整することで、ロボット工学に有望なパラダイムを提供する。
本研究では,サンプル効率,安全な行動改善のために,まず低次元潜在多様体の探索を制約するカリキュラム学習フレームワークであるSPAARSを紹介する。
本稿では、性能差分補題を用いた利用ギャップの上限を証明し、潜時空間政策勾配が生空間探索よりも証明可能な分散化を実現することを証明し、潜時位相における同時動作のクローンがカリキュラムの遷移安定性を直接制御していることを示す。
論文 参考訳(メタデータ) (2026-03-10T08:52:15Z) - Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties [26.41382315967256]
本稿では,安全な最適動作計画の必要性に対処する,リスクバウンドな新しい動き計画フレームワークを提案する。
動作不確実性下でのロボットの状態分布を予測するために,剛性マニピュレータ深部クープマン演算子 (RM-DeKO) モデルを統合する。
次に,並列物理シミュレーションとSOS(Sum-of-squares)プログラミングを併用して,衝突リスクのきめ細かい形式的証明を行う,効率的な階層的検証手法を提案する。
論文 参考訳(メタデータ) (2026-03-10T01:48:48Z) - MolmoSpaces: A Large-Scale Open Ecosystem for Robot Navigation and Manipulation [56.30931340537373]
MolmoSpacesは、ロボットポリシーのベンチマークをサポートするための、完全にオープンなエコシステムである。
MolmoSpacesは230万以上の屋内環境で構成されている。
MolmoSpaces-Benchは8つのタスクのベンチマークスイートで、ロボットが私たちの多様なシーンとリッチな注釈付きオブジェクトと対話する。
論文 参考訳(メタデータ) (2026-02-11T20:16:31Z) - Dynamic Model Selection for Trajectory Prediction via Pairwise Ranking and Meta-Features [0.0]
最近の深い軌道予測器は、高い平均精度を達成したが、複雑な長距離運転シナリオでは信頼性が保たれている。
物理インフォームドLSTM, トランスフォーマー, 微調整されたGameFormerのうち, もっとも信頼性の高い軌道予測器を適応的に選択する動的マルチエキスパートゲーティングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-31T10:01:01Z) - InternVLA-M1: A Spatially Guided Vision-Language-Action Framework for Generalist Robot Policy [138.89177083578213]
空間接地とロボット制御のための統合フレームワークであるInternVLA-M1を紹介する。
InternVLA-M1は、(i)2.3M以上の空間的推論データに基づく空間的グラウンドトレーニングと(ii)空間的に誘導された後トレーニングという、2段階のパイプラインを使用する。
結果: InternVLA-M1 は SimplerEnv Google Robot で+14.6%、WidowX で+17%、LIBERO Franka で+4.3% で、空間誘導なしでその変種を上回った。
論文 参考訳(メタデータ) (2025-10-15T17:30:05Z) - Text Adversarial Attacks with Dynamic Outputs [63.25160580569707]
テキスト逆攻撃法は典型的には、固定数の出力ラベルと予め定義されたラベル空間を持つ静的シナリオのために設計される。
本稿では,クラスタリングに基づく代理モデルトレーニング手法を用いたテキスト動的出力攻撃(TDOA)手法を提案する。
テキスト毎の単一のクエリで、TDOAは最大攻撃成功率は50.81%に達する。
我々は TDOA を生成環境に拡張し,0.64 RDBLEU と 0.62 RDchrF の先行結果を上回った。
論文 参考訳(メタデータ) (2025-09-26T14:21:46Z) - RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Randomization for Robust Bimanual Robotic Manipulation [52.2244588424002]
我々は,多様かつ現実的なデータの自動生成のためのスケーラブルなフレームワークであるRoboTwin 2.0を紹介する。
コアとなるRoboTwin-ODは、セマンティックおよび操作関連アノテーションを備えた147カテゴリにわたる771インスタンスのオブジェクトライブラリである。
sim-to-real転送を改善するために、RoboTwin 2.0は5つの軸に沿って構造化された領域ランダム化を適用する。
論文 参考訳(メタデータ) (2025-06-22T16:26:53Z) - From Seeing to Doing: Bridging Reasoning and Decision for Robotic Manipulation [35.79160868966466]
FSD(From Seeing to Doing)は空間関係推論により中間表現を生成する新しい視覚言語モデルである。
提案手法は,空間座標を視覚信号と整列する自己整合性機構と,階層的なデータパイプラインを併用する。
我々は、FSDがSimplerEnvで40.6%の成功率、実世界の8つのタスクで72%の成功率を達成したことを示し、最強のベースラインを30%上回った。
論文 参考訳(メタデータ) (2025-05-13T13:20:46Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。