論文の概要: LIBERO-Safety: A Comprehensive Benchmark for Physical and Semantic Safety in Vision-Language-Action Models
- arxiv url: http://arxiv.org/abs/2606.23686v1
- Date: Mon, 22 Jun 2026 17:59:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 17:08:18.909306
- Title: LIBERO-Safety: A Comprehensive Benchmark for Physical and Semantic Safety in Vision-Language-Action Models
- Title(参考訳): LIBERO-Safety:ビジョン・ランゲージ・アクションモデルにおける身体的・意味的安全性の総合的ベンチマーク
- Authors: Rongxu Cui, Zongzheng Zhang, Jingrui Pang, Haohan Chi, Jinbang Guo, Saining Zhang, Shaoxuan Xie, Xin Jin, Yao Mu, Jiaolong Yang, Guocai Yao, Xianyuan Zhan, Ya-Qin Zhang, Hao Zhao,
- Abstract要約: 包括性のある安全クリティカルシナリオを手続き的に生成するためのパラメトリック安全ベンチマークを導入する。
人間の遠隔操作のスケーラビリティを克服するため,新しいキー駆動型データ生成パイプラインを開発した。
スケーラブルなパイプライン、堅牢なデータセット、深い障害モードの洞察を提供することで、LIBERO-Safetyは安全で信頼性の高いVLAモデルを開発する上で重要な基盤を確立する。
- 参考スコア(独自算出の注目度): 41.877429133192514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the impressive manipulation capabilities of Vision-Language-Action (VLA) models, their operational safety under strict constraints remains largely unverified. To address this, we introduce a parametric safety benchmark to procedurally generate safety-critical scenarios with comprehensive stochasticity. To overcome the scalability bottlenecks of human teleoperation, we develop a novel keypose-driven data generation pipeline. Leveraging this infrastructure, we curate a large-scale dataset of 19,664 strictly collision-free demonstrations with extensive domain randomization. We then conduct a systematic cross-paradigm evaluation of eight VLA and two embodied foundation models. Our analysis reveals a critical generalization-safety tension: although high-diversity training fosters safer trajectories, task success remains fundamentally bottlenecked by sub-optimal trajectory synthesis and semantic misalignment. By providing a scalable pipeline, a robust dataset, and profound failure-mode insights, LIBERO-Safety establishes a crucial foundation for developing safe and reliable VLA models.
- Abstract(参考訳): VLA(Vision-Language-Action)モデルの印象的な操作能力にもかかわらず、厳密な制約の下での運用上の安全性はほとんど検証されていない。
これを解決するために、パラメトリック安全ベンチマークを導入し、包括的確率性を持つ安全クリティカルシナリオを手続き的に生成する。
遠隔操作のスケーラビリティのボトルネックを克服するため,我々は新しいキーポーズ駆動型データ生成パイプラインを開発した。
このインフラを活用して、広範囲なドメインランダム化を伴う19,664の厳密な衝突のないデモの大規模なデータセットをキュレートする。
次に,8つのVLAと2つの具体的基礎モデルの系統的相互パラダイム評価を行う。
高多様性トレーニングはより安全な軌道を奨励するが、タスク成功は、準最適軌道合成とセマンティックミスアライメントによって根本的にボトルネックとなる。
スケーラブルなパイプライン、堅牢なデータセット、深い障害モードの洞察を提供することで、LIBERO-Safetyは安全で信頼性の高いVLAモデルを開発する上で重要な基盤を確立する。
関連論文リスト
- Uncovering Linguistic Fragility in Vision-Language-Action Models via Diversity-Aware Red Teaming [64.48633529149579]
本稿では,VLA(Vision-Language-Action)モデルの言語的変異に対する脆弱性を明らかにするための新しいフレームワークを提案する。
本手法は, ストレス試験用VLAエージェントへのスケーラブルなアプローチを示すため, 平均作業成功率を93.33%から5.85%に下げる。
論文 参考訳(メタデータ) (2026-04-07T08:43:36Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Breaking the Safety-Capability Tradeoff: Reinforcement Learning with Verifiable Rewards Maintains Safety Guardrails in LLMs [3.198812241868092]
検証可能な報酬(RLVR)による強化学習は、客観的に測定可能なタスクのモデルを最適化する有望な代替手段として登場した。
RLVRにおける安全特性の総合的・実証的な分析を行った。
実証実験により,RLVRは安全ガードレールの維持・改善を図りながら推論能力を同時に向上できることを示す。
論文 参考訳(メタデータ) (2025-11-26T04:36:34Z) - Probabilistic Robustness Analysis in High Dimensional Space: Application to Semantic Segmentation Network [6.587910936799125]
本稿では,アーキテクチャに依存しない,スケーラブルで高次元出力が可能な確率的検証フレームワークを提案する。
提案手法は,サンプルベースリーチビリティ解析と共形推論(CI)を組み合わせて,証明可能な保証を提供する。
提案手法は,SOTAに比べて厳密な境界を保ちながら,信頼性の高い安全保証を提供することを示す。
論文 参考訳(メタデータ) (2025-09-15T12:25:25Z) - Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models [25.606641582511106]
モデル性能を向上させるために,マルチイメージ入力と安全チェーン・オブ・ソート(CoT)ラベルを微粒な推論ロジックとして統合する新しいデータセットを提案する。
実験の結果,MISを用いた微調整InternVL2.5-8Bは,マルチイメージタスクに挑戦する上で,強力なオープンソースモデルとAPIベースモデルの両方を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2025-01-30T17:59:45Z) - Safe Inputs but Unsafe Output: Benchmarking Cross-modality Safety Alignment of Large Vision-Language Model [73.8765529028288]
我々は、モダリティ間の安全アライメントを評価するために、セーフインプットとアンセーフアウトプット(SIUO)と呼ばれる新しい安全アライメントの課題を導入する。
この問題を実証的に調査するため,我々はSIUOを作成した。SIUOは,自己修復,違法行為,プライバシー侵害など,9つの重要な安全領域を含むクロスモダリティベンチマークである。
以上の結果から, クローズドおよびオープンソース両方のLVLMの安全性上の重大な脆弱性が明らかとなり, 複雑で現実的なシナリオを確実に解釈し, 応答する上で, 現行モデルが不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T16:14:15Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。