論文の概要: ROBOSHACKLES: A Safety Dataset for Human-Injury Prevention in Embodied Foundation Models
- arxiv url: http://arxiv.org/abs/2606.18632v1
- Date: Wed, 17 Jun 2026 03:03:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.980607
- Title: ROBOSHACKLES: A Safety Dataset for Human-Injury Prevention in Embodied Foundation Models
- Title(参考訳): ROBOSHACKLES: 身体的基礎モデルにおける人体傷害予防のための安全データセット
- Authors: Zhuowen Yin, Chongyang Liu, Wenzhang Yang, Renjue Li, Yinxing Xue,
- Abstract要約: Embodied Foundation Models (EFMs)は、マルチモーダル理解、将来の状態推論、実行可能なロボットアクションを統合する。
この課題に対処するために,EMFにおける人体傷害防止のための安全クリティカルなデータ構築パイプラインを提案する。
実際のDROID観測から得られた1万クリップのロボットビデオデータセットであるROBOSHACKLESを構築した。
評価されたモデルはすべて、テストされた安全クリティカルなシナリオにおいて安全でないアクションを生成し、100%の安全でないアクション生成率が得られることを示す。
- 参考スコア(独自算出の注目度): 5.812025441769613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied Foundation Models (EFMs) integrate multimodal understanding, future-state reasoning, and executable robot actions. Yet their safety alignment for human-injury prevention remains underexplored, primarily because real-world data of robots harming humans or creating hazardous household situations cannot be safely or ethically collected. To address this challenge, we propose a safety-critical data construction pipeline for human-injury prevention in EFMs.Starting from real DROID observations, our construction pipeline proceeds through scene understanding, hazard-aware image editing, temporal prompt generation, and single-pass rollout synthesis. The temporal prompts specify the expected scene evolution, while Wan2.7 synthesizes realistic robotic rollouts from the edited hazardous states in a single pass. Using this pipeline, we construct ROBOSHACKLES, a 10,000-clip robotic video dataset derived from real DROID observations, spanning two direct-harm and four indirect-harm categories. To ensure dataset quality, we assess task completion and visual quality with automatic metrics, and evaluate six representative EFMs under a refusal-based safety criterion. Results show that all evaluated models produce unsafe actions in the tested safety-critical scenarios, yielding a 100% unsafe action generation rate. ROBOSHACKLES serves as a scalable benchmark and training resource for refusal learning and hazard anticipation before robot action execution.The dataset is publicly available at https://huggingface.co/datasets/YZW00/RoboShackles.
- Abstract(参考訳): Embodied Foundation Models (EFMs)は、マルチモーダル理解、将来の状態推論、実行可能なロボットアクションを統合する。
しかし、人間に危害を与えるロボットや危険な家庭の状況を生み出す現実世界のデータは、安全かつ倫理的に収集できないため、人身被害防止のための安全アライメントはいまだ研究されていない。
実際のDROID観測から始まり、シーン理解、ハザード対応画像編集、時間的プロンプト生成、シングルパスロールアウト合成を通じて構築パイプラインを進行させる。
時間的プロンプトは、期待されるシーンの進化を規定し、Wan2.7は、1回のパスで編集された有害な状態から現実的なロボットロールアウトを合成する。
このパイプラインを用いて,実際のDROID観測から得られた1万クリックのロボットビデオデータセットであるROBOSHACKLESを構築し,2つのダイレクトハームと4つの間接ハームのカテゴリにまたがる。
データセットの品質を確保するため,自動メトリクスを用いてタスク完了と視覚的品質を評価し,リファリベース安全基準の下で6つの代表的なEMFを評価する。
評価されたモデルはすべて、テストされた安全クリティカルなシナリオにおいて安全でないアクションを生成し、100%の安全でないアクション生成率が得られることを示す。
ROBOSHACKLESは、ロボットアクション実行前の学習とハザード予測を拒否するためのスケーラブルなベンチマークおよびトレーニングリソースとして機能し、データセットはhttps://huggingface.co/datasets/YZW00/RoboShacklesで公開されている。
関連論文リスト
- Targeting World Models to Compromise Robot Learning Pipelines [18.24564473642909]
我々は、世界モデルがロボット学習サプライチェーンにステルスで効果的なデータ中毒のエントリポイントを導入することを実証した。
我々の新しい攻撃手法は、世界モデルを介して一度だけ活性化された遠隔操作データセットに悪意あるプロンプトを注入する。
これにより、合成され、危険なロボット訓練軌道が生成され、その後、安全でない、あるいは侵害されたロボットポリシーが生成される。
論文 参考訳(メタデータ) (2026-06-08T13:50:31Z) - VLESA: Vision-Language Embodied Safety Agent for Human Activity Monitoring [60.53395558502203]
Vision-Language Embodied Safety Agent (VLESA)は、自我中心のビデオから人間の活動を監視する。
VLESAは、コンテキストに応じて同一のアクションが安全または危険である意図に依存した安全性に対処する。
目標を共同で推測し,映像から将来の行動を予測するための意図-行動予測エージェントを提案する。
論文 参考訳(メタデータ) (2026-06-02T17:42:17Z) - Learning Safe-Stoppability Monitors for Humanoid Robots [11.850318870435265]
我々は,ヒューマノイドの緊急停止を政策依存型安全性問題として定式化する。
我々はPRISMを紹介した。PRISMはシミュレーション駆動のフレームワークで、状態レベルのストッパビリティのための神経予測器を学習する。
以上の結果から,政策依存的停止性としての安全性のモデル化により,積極的な安全監視が可能であり,ヒューマノイドロボットのフェールセーフ動作のスケーラブルな認証を支援することが示唆された。
論文 参考訳(メタデータ) (2026-03-24T01:51:32Z) - ANNIE: Be Careful of Your Robots [48.89876809734855]
エンボディドAIシステムに対する敵の安全攻撃に関する最初の体系的研究について述べる。
すべての安全カテゴリーで攻撃の成功率は50%を超えている。
結果は、実証済みのAIシステムにおいて、これまで未調査だったが、非常に連続的な攻撃面を露呈する。
論文 参考訳(メタデータ) (2025-09-03T15:00:28Z) - Context-Aware Risk Estimation in Home Environments: A Probabilistic Framework for Service Robots [2.5695499302569327]
本稿では,サービスロボットにおけるリアルタイムのリスク認識向上を目的とした,日常の屋内シーンにおける事故発生地域を推定するための新しい枠組みを提案する。
提案手法は,セマンティックグラフに基づく伝搬アルゴリズムを用いて,オブジェクトレベルのリスクとコンテキストをモデル化する。
提案手法は,人間に注釈を付けたリスク領域を持つデータセット上で検証され,リスク検出精度は75%である。
論文 参考訳(メタデータ) (2025-08-27T11:14:05Z) - SafeAgent: Safeguarding LLM Agents via an Automated Risk Simulator [77.86600052899156]
LLM(Large Language Model)ベースのエージェントは、現実のアプリケーションにますますデプロイされる。
完全自動合成データ生成によるエージェント安全性を体系的に向上する最初のフレームワークであるAutoSafeを提案する。
AutoSafeは安全性のスコアを平均で45%向上させ、現実世界のタスクでは28.91%の改善を実現している。
論文 参考訳(メタデータ) (2025-05-23T10:56:06Z) - Don't Let Your Robot be Harmful: Responsible Robotic Manipulation via Safety-as-Policy [53.048430683355804]
ロボット操作における人間の指示の実行は、深刻な安全性のリスクにつながる可能性がある。
i) 安全リスクを含むシナリオを自動生成し、仮想的なインタラクションを行う世界モデルと、(ii) 反射による結果を予測するメンタルモデルを含む。
本研究は, 安全行政がリスクを回避し, 合成データセットと実世界の両方の実験において, 効率的にタスクを完了できることを実証する。
論文 参考訳(メタデータ) (2024-11-27T12:27:50Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。