論文の概要: SafeMind: A Risk-Aware Differentiable Control Framework for Adaptive and Safe Quadruped Locomotion
- arxiv url: http://arxiv.org/abs/2604.09474v1
- Date: Fri, 10 Apr 2026 16:33:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.963146
- Title: SafeMind: A Risk-Aware Differentiable Control Framework for Adaptive and Safe Quadruped Locomotion
- Title(参考訳): SafeMind: 適応的で安全な四足歩行のためのリスク対応微分制御フレームワーク
- Authors: Zukun Zhang, Kai Shu, Mingqiao Mo,
- Abstract要約: SafeMindは、学習ベースの四脚制御のための差別化可能な安全制御フレームワークである。
SafeMindは、微分可能プログラムに埋め込まれた分散認識バリア制約を通じて、明示的にモデルとアレータリック不確かさをモデル化する。
SafeMindは, 最先端CBF, MPC, ハイブリッドRLベースラインと比較して, 安全違反を3~10倍削減し, エネルギー消費を10~15%削減することを示した。
- 参考スコア(独自算出の注目度): 19.50816075941739
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based quadruped controllers achieve impressive agility but typically lack formal safety guarantees under model uncertainty, perception noise, and unstructured contact conditions. We introduce SafeMind, a differentiable stochastic safety-control framework that unifies probabilistic Control Barrier Functions with semantic context understanding and meta-adaptive risk calibration. SafeMind explicitly models epistemic and aleatoric uncertainty through a variance-aware barrier constraint embedded in a differentiable quadratic program, thereby preserving gradient flow for end-to-end training. A semantics-to-constraint encoder modulates safety margins using perceptual or language cues, while a meta-adaptive learner continuously adjusts risk sensitivity across environments. We provide theoretical conditions for probabilistic forward invariance, feasibility, and stability under stochastic dynamics. SafeMind is deployed on Unitree A1 and ANYmal C at 200~Hz and validated across 12 terrain types, dynamic obstacles, morphology perturbations, and semantically defined tasks. Experiments show that SafeMind reduces safety violations by 3--10x and energy consumption by 10--15% relative to state-of-the-art CBF, MPC, and hybrid RL baselines, while maintaining real-time control performance.
- Abstract(参考訳): 学習ベースの四重組コントローラーは、印象的な俊敏性を達成するが、モデルの不確実性、知覚ノイズ、非構造接触条件の下では、形式的な安全保証が欠如している。
本稿では,意味的コンテキスト理解とメタ適応型リスクキャリブレーションを備えた確率論的制御バリア関数を統一した,確率論的安全制御フレームワークであるSafeMindを紹介する。
SafeMindは、微分可能二次プログラムに埋め込まれた分散認識バリア制約を通じて、てんかんおよびアレタリック不確実性を明示的にモデル化し、エンドツーエンドトレーニングのための勾配流を保存する。
セマンティックス・トゥ・制約エンコーダは知覚的・言語的手がかりを用いて安全マージンを調整し、メタ適応学習者は環境間のリスク感度を継続的に調整する。
確率的前方不変性(probabilistic forward invariance), 実現可能性(probabilistic forward invariance), 確率力学(probabilistic forward invariance), 確率的確率論(probabilistic forward invariance), 確率的確率論(probabilistic forward invariance), 確率的確率論(probabilistic forward invariant),
SafeMindは200〜HzでUnitree A1とANYmal Cにデプロイされ、12の地形タイプ、動的障害物、形態的摂動、意味論的に定義されたタスクで検証される。
実験により、SafeMindは、リアルタイム制御性能を維持しながら、最先端のCBF、MPC、ハイブリッドRLベースラインと比較して安全違反を3~10倍削減し、エネルギー消費を10~15%削減することが示された。
関連論文リスト
- Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty [5.99447754429793]
多くの安全クリティカル制御システムは、センサーが決定時に直接解決できないという遅延不確実性の下で動作しなければならない。
標準的な手法は期待されたパフォーマンスを最適化し、稀だが深刻な結果に対する限定的な保護を提供する。
本稿では, 力学, コスト, 安全性の制約が, 信念分布として維持される潜在パラメータに依存する, 部分的に観察された力学系について考察する。
論文 参考訳(メタデータ) (2026-04-04T21:22:44Z) - Response-Aware Risk-Constrained Control Barrier Function With Application to Vehicles [0.0]
本稿では,車両の動的安全境界制御のための応答認識型リスク制約制御バリア関数に基づく統合制御フレームワークを提案する。
このフレームワークは、制御勾配の基準方向を提供するために、名目力学と直接車体応答を融合する。
また、従来の決定論的安全制約をバリア関数誘導体のテールリスクに関する確率論的制約に再構成する。
論文 参考訳(メタデータ) (2026-03-13T02:38:17Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models [67.91151588917396]
大規模言語モデル(LLM)は、幅広いタスクで顕著な進歩を遂げているが、有害なコンテンツ生成やジェイルブレイク攻撃といった安全リスクに弱いままである。
安全に配慮したリサイクルによるLCMの安全性向上のための統合フレームワークであるUpSafe$circ$Cを提案する。
この結果から, 静的アライメントから動的, モジュール, 推論対応制御への移行という, LLMの安全性の新たな方向性が明らかになった。
論文 参考訳(メタデータ) (2025-10-02T16:43:33Z) - Statistical Safety and Robustness Guarantees for Feedback Motion
Planning of Unknown Underactuated Stochastic Systems [1.0323063834827415]
本研究では, 平均力学モデルを用いたサンプリングベースプランナを提案し, 学習外乱境界による閉ループ追従誤差を同時に有界化する。
この保証は,10次元四角形ロボットのシミュレーションや,クレージーフライ四角形ロボットとクリアパスジャカルロボットの現実世界でのシミュレーションにおいて,経験的安全性に変換されることを検証した。
論文 参考訳(メタデータ) (2022-12-13T19:38:39Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - ProBF: Learning Probabilistic Safety Certificates with Barrier Functions [31.203344483485843]
制御バリア関数は、地平系力学にアクセスできれば安全を保証できる便利なツールである。
実際には、システムダイナミクスに関する不正確な知識があるため、安全でない振る舞いにつながる可能性があります。
本手法の有効性をSegwayとQuadrotorのシミュレーション実験により示す。
論文 参考訳(メタデータ) (2021-12-22T20:18:18Z) - Lyapunov-based uncertainty-aware safe reinforcement learning [0.0]
InReinforcement Learning (RL)は、様々なシーケンシャルな意思決定タスクに対して最適なポリシーを学ぶ上で、有望なパフォーマンスを示している。
多くの現実世界のRL問題において、主な目的を最適化する以外に、エージェントは一定のレベルの安全性を満たすことが期待されている。
これらの制約に対処するために,リャプノフに基づく不確実性を考慮した安全なRLモデルを提案する。
論文 参考訳(メタデータ) (2021-07-29T13:08:15Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。