論文の概要: Safety Certification in the Latent space using Control Barrier Functions and World Models
- arxiv url: http://arxiv.org/abs/2507.13871v1
- Date: Fri, 18 Jul 2025 12:50:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.285816
- Title: Safety Certification in the Latent space using Control Barrier Functions and World Models
- Title(参考訳): 制御バリア関数と世界モデルを用いた潜伏空間の安全性証明
- Authors: Mehul Anand, Shishir Kolathaya,
- Abstract要約: 本稿では、世界モデルの潜在空間で学んだ制御障壁証明書(CBC)を利用して安全なビズモータポリシーを合成する半教師付きフレームワークを提案する。
提案手法は, ラベリングされた限られたデータを用いて, ニューラルバリア関数と安全な制御器を共同で学習し, 潜時力学モデリングのための現代の視覚変換器の予測能力を利用した。
- 参考スコア(独自算出の注目度): 0.9480364746270075
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Synthesising safe controllers from visual data typically requires extensive supervised labelling of safety-critical data, which is often impractical in real-world settings. Recent advances in world models enable reliable prediction in latent spaces, opening new avenues for scalable and data-efficient safe control. In this work, we introduce a semi-supervised framework that leverages control barrier certificates (CBCs) learned in the latent space of a world model to synthesise safe visuomotor policies. Our approach jointly learns a neural barrier function and a safe controller using limited labelled data, while exploiting the predictive power of modern vision transformers for latent dynamics modelling.
- Abstract(参考訳): 視覚データから安全なコントローラを合成するには、安全クリティカルなデータの広範囲なラベル付けが必要となる。
近年の世界モデルの進歩により、潜在空間における信頼性の高い予測が可能となり、スケーラブルでデータ効率の良い安全な制御のための新たな道が開かれた。
本研究では、世界モデルの潜伏空間で学んだ制御バリア証明書(CBC)を利用して安全なビジュモータポリシーを合成する半教師付きフレームワークを提案する。
提案手法は, ラベリングされた限られたデータを用いて, ニューラルバリア関数と安全な制御器を共同で学習し, 潜時力学モデリングのための現代の視覚変換器の予測能力を利用した。
関連論文リスト
- Rethinking Data Protection in the (Generative) Artificial Intelligence Era [115.71019708491386]
現代の(生産的な)AIモデルやシステムに生じる多様な保護ニーズを捉える4段階の分類法を提案する。
当社のフレームワークは、データユーティリティとコントロールのトレードオフに関する構造化された理解を提供し、AIパイプライン全体にわたっています。
論文 参考訳(メタデータ) (2025-07-03T02:45:51Z) - Safely Learning Controlled Stochastic Dynamics [61.82896036131116]
システム力学の安全な探索と効率的な推定を可能にする手法を提案する。
学習後、学習モデルはシステムのダイナミクスの予測を可能にし、任意の制御の安全性検証を可能にする。
我々は、真の力学のソボレフ正則性を高めることにより、安全性と適応学習率の向上を理論的に保証する。
論文 参考訳(メタデータ) (2025-06-03T11:17:07Z) - Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - Data-Driven Safety Verification using Barrier Certificates and Matrix Zonotopes [1.6078581568133972]
ノイズの多いデータから直接システムの安全性を検証するための,データ駆動型安全性検証フレームワークを提案する。
1つの信頼できないモデルを信頼するのではなく、観測されたデータと整合する一連のモデルを構築します。
このモデル集合は行列ゾノトープを用いてコンパクトに表現され、効率的な計算と不確実性の伝播を可能にする。
論文 参考訳(メタデータ) (2025-04-01T17:46:42Z) - Learning Vision-Based Neural Network Controllers with Semi-Probabilistic Safety Guarantees [24.650302053973142]
本稿では, 到達可能性解析と条件付き生成逆数ネットワークを統合した, 半確率的検証フレームワークを提案する。
次に, 新たな安全損失関数, 安全対応型データサンプリング戦略, カリキュラム学習を活用した勾配学習手法を提案する。
X-Plane 11航空機の着陸シミュレーション, CARLAシミュレーションによる自律走行車線, F110thレーンの視覚的に豊かなミニチュア環境下での実証実験により, 本手法の有効性が証明された。
論文 参考訳(メタデータ) (2025-02-28T21:16:42Z) - Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.267574471145217]
Hamilton-Jacobi (H) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。
生観測データを直接操作する潜在空間到達性であるLa Safety Filtersを提案する。
論文 参考訳(メタデータ) (2025-02-02T22:00:20Z) - One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments [10.103090762559708]
観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。
我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。
提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
論文 参考訳(メタデータ) (2024-12-13T09:21:02Z) - Detectors for Safe and Reliable LLMs: Implementations, Uses, and Limitations [76.19419888353586]
大規模言語モデル(LLM)は、不誠実なアウトプットからバイアスや有害な世代に至るまで、さまざまなリスクを受けやすい。
我々は,様々な害のラベルを提供するコンパクトで容易に構築できる分類モデルである,検出器のライブラリを作成し,展開する取り組みについて述べる。
論文 参考訳(メタデータ) (2024-03-09T21:07:16Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Scalable Synthesis of Verified Controllers in Deep Reinforcement
Learning [0.0]
高品質の安全シールドを合成できる自動検証パイプラインを提案します。
私たちの重要な洞察は、事前に計算された安全シールドを使用して神経コントローラのトレーニングを制限し、神経コントローラから安全検証を分離することを含みます。
実測的な高次元深部RLベンチマークによる実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-04-20T19:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。