論文の概要: Verifiable Foundation Models for Robot Safety
- arxiv url: http://arxiv.org/abs/2606.23754v1
- Date: Mon, 22 Jun 2026 03:10:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.597348
- Title: Verifiable Foundation Models for Robot Safety
- Title(参考訳): ロボット安全のための検証可能な基礎モデル
- Authors: Davide Corsi, Kyungmin Kim, Roy Fox,
- Abstract要約: FEARL(Foundation-Enabled Assured Robot Learning)は、モジュラーアーキテクチャの分解によってこの緊張に対処するフレームワークである。
FEARLは、このポリシーを、高次元の知覚とタスク推論に責任を持つ大きなコントローラ(C)と、専用の安全センサーから低次元の観測を受ける小さな安全モジュール(S)に分けている。
これにより、タスク推論のためのコントローラの表現力を維持しながら、既存のツールで正式な分析が行えるようになります。
- 参考スコア(独自算出の注目度): 9.839166424557009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying foundation models for robot control raises a central challenge: the expressive power that enables rich, multimodal perception also makes these models opaque and difficult to analyze formally, rendering them intractable for existing verification tools. In this paper, we present FEARL (Foundation-Enabled Assured Robot Learning), a framework that addresses this tension through a modular architectural decomposition. FEARL separates the policy into a large Controller (C) responsible for high-dimensional perception and task reasoning, and a small Safety module (S) that receives low-dimensional observations from dedicated safety sensors together with a bounded context embedding from C and produces the final action. Since many robot safety requirements, such as collision avoidance and workspace boundary constraints, can be expressed over these safety sensor observations, formal verification can be applied to S rather than to the full foundation-model backbone. This makes formal analysis tractable with existing tools while preserving the Controller's expressive power for task reasoning. To show that the decomposed policy remains capable of solving diverse tasks, we evaluate FEARL on three simulated robotic domains using multiple Controller backbones and training procedures, including pretrained off-the-shelf vision-language-action models. We further transfer the learned policy from one of our simulated tasks to a physical robot, suggesting that the low-dimensional safety interface supports practical sim-to-real transfer.
- Abstract(参考訳): リッチでマルチモーダルな知覚を可能にする表現力によって、これらのモデルが不透明で、形式的に解析することが難しくなり、既存の検証ツールでは難解なものになる。
本稿では,この緊張に対処するフレームワークであるFEARL(Foundation-Enabled Assured Robot Learning)を提案する。
FEARLは、このポリシーを、高次元の知覚とタスク推論に責任を負う大きなコントローラ(C)と、Cから埋め込まれたコンテキスト境界とともに専用の安全センサーから低次元の観察を受け、最終的なアクションを生成する小さな安全モジュール(S)に分離する。
衝突回避やワークスペース境界制約などの多くのロボット安全要件は、これらの安全センサ観測を通して表現できるため、完全な基礎モデルバックボーンではなく、Sに形式的検証を適用することができる。
これにより、タスク推論のためのコントローラの表現力を維持しながら、既存のツールで正式な分析が行えるようになります。
分割されたポリシーが多様なタスクを解くことができることを示すため、複数のコントローラバックボーンとトレーニング手順を用いて、FEARLを3つの模擬ロボットドメイン上で評価する。
シミュレーションされたタスクの1つから物理ロボットに学習ポリシーを転送し、低次元の安全インタフェースが実用的なシミュレート・トゥ・リアル・トランスファーをサポートすることを示唆する。
関連論文リスト
- Modular Safety Guardrails Are Necessary for Foundation-Model-Enabled Robots in the Real World [42.7330476721001]
静的検証、モノリシックコントローラ、エンドツーエンドの学習ポリシーを含む既存のアプローチは、タスク、環境、人間の期待がオープンで、長い目で見たり、時間の経過とともに適応されるような環境では不十分である、と我々は主張する。
自律スタック全体にわたる包括的安全のためのアーキテクチャ基盤として,監視(評価)層と介入層からなるモジュール型安全ガードレールを提案する。
論文 参考訳(メタデータ) (2026-02-03T22:41:51Z) - Vision-based Goal-Reaching Control for Mobile Robots Using a Hierarchical Learning Framework [4.014524824655106]
本稿では,システム全体を密結合した関数モジュールの集合に分解する。
提案手法は,アクティベーションシステムの均一な指数的安定性と全動作の安全性を保証する。
論文 参考訳(メタデータ) (2026-01-02T08:41:47Z) - OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [77.95511352806261]
VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文 参考訳(メタデータ) (2025-10-28T13:22:39Z) - Constrained Decoding for Robotics Foundation Models [12.916330118607918]
本稿では,自動回帰ロボット基盤モデルのための制約付き復号化フレームワークであるSafeDecを紹介する。
タスク固有の安全ルールはSignal Temporal Logic (STL) 公式として表現され、最小限のオーバーヘッドで推論時に強制される。
提案手法は,実行時に仮定された動的条件下でのSTL仕様を,再トレーニングなしで確実に満たすものである。
論文 参考訳(メタデータ) (2025-09-01T19:17:40Z) - Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.267574471145217]
Hamilton-Jacobi (H) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。
生観測データを直接操作する潜在空間到達性であるLa Safety Filtersを提案する。
論文 参考訳(メタデータ) (2025-02-02T22:00:20Z) - Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.36528819227641]
本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。
我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文 参考訳(メタデータ) (2024-11-18T01:52:20Z) - Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot [19.789369416528604]
グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。
以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。
シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
論文 参考訳(メタデータ) (2023-11-13T11:29:06Z) - Robotic Handling of Compliant Food Objects by Robust Learning from
Demonstration [79.76009817889397]
本稿では,食品に適合する物体をロボットで把握する上で,実証からの学習(LfD)に基づく頑健な学習方針を提案する。
教師の意図した方針を推定し,無矛盾な実演を自動的に除去するLfD学習ポリシーを提案する。
提案されたアプローチは、前述の業界セクターで幅広い応用が期待できる。
論文 参考訳(メタデータ) (2023-09-22T13:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。