論文の概要: Cooptimizing Safety and Performance Using Safety Value-Constrained Model Predictive Control
- arxiv url: http://arxiv.org/abs/2604.23863v1
- Date: Sun, 26 Apr 2026 20:10:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.60166
- Title: Cooptimizing Safety and Performance Using Safety Value-Constrained Model Predictive Control
- Title(参考訳): 安全性制約付きモデル予測制御による安全性と性能の最適化
- Authors: Hao Wang, Nam Nguyen, Armand Jordana, Ludovic Righetti, Somil Bansal,
- Abstract要約: 本稿では,各計画地平線の終端に,制御不変の安全セットのメンバシップを強制する安全値関数に基づく端末制約を提案する。
この定式化により、高性能かつ確実に安全な軌道のリアルタイム合成が可能となる。
本研究では,Flexiv Rizon 10s マニピュレータ上でのシミュレーションおよびハードウェア実験により,提案手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 14.944399584182017
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous systems are increasingly deployed in real-world environments, where they must achieve high performance while maintaining safety under state and input constraints. Although Model Predictive Control (MPC) provides a principled framework for constrained optimal control, guaranteeing safety beyond its finite planning horizon remains a fundamental challenge. In this work, we augment MPC with a safety value function-based terminal constraint that enforces membership in a control-invariant safe set at the end of each planning horizon. This formulation enables real-time synthesis of trajectories that are both high-performing and provably safe. We show that, under an exact safety value function and a feasible initialization, the proposed MPC scheme is recursively feasible, thereby ensuring persistent safety. In contrast to traditional terminal set constructions that rely on local linearizations or conservative approximations, our approach incorporates a reachability-based safety value function for terminal constraints, yielding less conservative and more expressive safety guarantees. We validate the proposed framework through simulation and hardware experiments on a Flexiv Rizon 10s manipulator. Results demonstrate improved constraint satisfaction and robustness compared to standard state-constrained MPC and reactive safety filtering, while maintaining competitive task performance. The full implementation and experiments are available on the project website.
- Abstract(参考訳): 自律システムは、状態や入力制約下での安全性を維持しながら、ハイパフォーマンスを達成しなければならない、現実世界の環境にますますデプロイされている。
モデル予測制御(MPC)は、制約された最適制御のための原則的なフレームワークを提供するが、その有限計画地平線を超えた安全性を保証することは、依然として根本的な課題である。
本研究は,MPCを安全値関数に基づく端末制約で拡張し,各計画地平線の終了時に制御不変の安全セットにメンバシップを強制する。
この定式化により、高性能かつ確実に安全な軌道のリアルタイム合成が可能となる。
提案手法は, 正確な安全性関数と実現可能な初期化の下で再帰的に実現可能であることを示し, 持続的安全性を確保する。
局所線形化や保守的近似に依存する従来の端末セット構成とは対照的に,本手法では端末制約に対する到達可能性に基づく安全値関数を導入し,より保守的で表現力に富んだ安全保証を実現する。
本研究では,Flexiv Rizon 10s マニピュレータ上でのシミュレーションおよびハードウェア実験により,提案手法の有効性を検証した。
その結果、競争力のあるタスク性能を維持しつつ、標準的な状態制約型MPCやリアクティブセーフティフィルタリングと比較して、制約満足度とロバスト性が改善された。
完全な実装と実験はプロジェクトのWebサイトにある。
関連論文リスト
- Beyond Hard Constraints: Budget-Conditioned Reachability For Safe Offline Reinforcement Learning [13.674504740468159]
安全到達性セットは、不安定なmin/maxやラグランジアン最適化を伴わずに、いかに安全制約を強制するかを示す。
また、このセットが不安定なmin/maxやラグランジアン最適化を使わずに、いかに安全性の制約を強制するかを示す。
本手法は,安全性を維持しつつ,アートベースラインの状態に適合または優れる。
論文 参考訳(メタデータ) (2026-03-08T11:09:33Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models [67.91151588917396]
大規模言語モデル(LLM)は、幅広いタスクで顕著な進歩を遂げているが、有害なコンテンツ生成やジェイルブレイク攻撃といった安全リスクに弱いままである。
安全に配慮したリサイクルによるLCMの安全性向上のための統合フレームワークであるUpSafe$circ$Cを提案する。
この結果から, 静的アライメントから動的, モジュール, 推論対応制御への移行という, LLMの安全性の新たな方向性が明らかになった。
論文 参考訳(メタデータ) (2025-10-02T16:43:33Z) - A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems [8.347548017994178]
安全性とパフォーマンスは競合する目標になり得るため、共同最適化が難しくなる。
本稿では,性能目標をコスト関数で符号化し,安全性要件を状態制約として課す,状態制約付き最適制御問題を提案する。
結果値関数はハミルトン・ヤコビ・ベルマン方程式を満たすことを示した。
論文 参考訳(メタデータ) (2025-02-16T09:46:17Z) - Iterative Reachability Estimation for Safe Reinforcement Learning [23.942701020636882]
安全制約付き強化学習(RL)環境のための新しいフレームワークRESPO(Reachability Estimation for Safe Policy Optimization)を提案する。
違反のないポリシーが存在する現実的な環境では、永続的な安全を維持しながら報酬を最適化します。
安全ガイム, PyBullet, および MuJoCo を用いた安全RL環境の多種多様な構成について, 提案手法の評価を行った。
論文 参考訳(メタデータ) (2023-09-24T02:36:42Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。