論文の概要: Online Safety Filter for Deformable Object Manipulation with Horizon Agnostic Neural Operators
- arxiv url: http://arxiv.org/abs/2605.01069v1
- Date: Fri, 01 May 2026 20:06:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.565382
- Title: Online Safety Filter for Deformable Object Manipulation with Horizon Agnostic Neural Operators
- Title(参考訳): 水平非依存型ニューラル演算子を用いた変形性物体マニピュレーションのためのオンライン安全フィルタ
- Authors: Jiaxing Li, Hanjiang Hu, Zhuoyuan Wang, Yorie Nakahira, Changliu Liu,
- Abstract要約: 変形可能なオブジェクト操作のための制約駆動型オンライン安全フィルタを提案する。
このフィルタは、名目制御ポリシーを最小限に修正することで、タスクレベルの安全性の制約をリアルタイムで実施する。
提案手法はFluidLabにおいて,フィルタがフィルタされていない基本方針に対して,安全な軌道速度を最大22%向上させる。
- 参考スコア(独自算出の注目度): 25.931880819916643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety critical control of robotic manipulation tasks involving deformable media such as fluids, cloth, and soft objects remains challenging because existing learning based approaches encode safety indirectly through reward shaping, which provides no guarantee of constraint satisfaction at deployment. We present a constraint driven online safety filter for deformable object manipulation that enforces explicit task level safety constraints in real time by minimally modifying any nominal control policy. Our approach combines two key components: a horizon agnostic neural operator that learns the boundary input output mapping of the underlying PDE dynamics and generalizes across variable rollout lengths without retraining, and a boundary control barrier function that certifies safety at the task relevant output level via a lightweight quadratic program. The resulting safety constraint is affine in the boundary input rate, enabling real time online filtering. We evaluate the proposed method on fluid manipulation tasks in FluidLab, where the filter improves safe trajectory rates by up to 22% over unfiltered base policies while also reducing the number of steps required to reach the safe set, demonstrating that constraint driven safety enforcement is both more reliable and more efficient than reward shaping approaches.
- Abstract(参考訳): 既存の学習ベースアプローチは報酬形成を通じて安全性を間接的に符号化しているため、流体、布、軟質物体などの変形可能なメディアを含むロボット操作タスクの安全クリティカルコントロールは、デプロイメントにおける制約満足度を保証しない。
本稿では,変形可能なオブジェクト操作のための制約駆動型オンライン安全フィルタを提案する。
提案手法は,PDEダイナミックスの境界入力出力マッピングを学習し,リトレーニングなしで可変ロールアウト長を一般化する水平非依存ニューラル演算子と,軽量2次プログラムを用いてタスク関連出力レベルでの安全性を保証する境界制御バリア関数の2つの重要な要素を組み合わせる。
結果として生じる安全制約は境界入力レートにアフィンであり、リアルタイムオンラインフィルタリングを可能にする。
提案手法はFluidLabにおいて,フィルタが未フィルタリングベースポリシーに対して最大22%の安全軌道速度を向上すると同時に,安全セットに到達するために必要なステップ数を削減し,制約駆動型安全対策が報酬形成アプローチよりも信頼性が高く,効率が高いことを示す。
関連論文リスト
- Safe Flow Q-Learning: Offline Safe Reinforcement Learning with Reachability-Based Flow Policies [0.764671395172401]
オフライン安全な強化学習は、厳格な安全制約の下で静的データセットから報酬を最大化するポリシーを求める。
安全なフローQ-Learning(SafeFQL)を提案する。これは、Hamilton-Jacobiリーチビリティにインスパイアされた安全値関数と効率的なワンステップフローポリシを組み合わせることで、FQLを安全なオフラインRLに拡張する。
ボートナビゲーション全体とSafe Gymnasium MuJoCoタスク、SafeFQLは、事前のオフラインセーフなRLパフォーマンスと一致またはオーバーし、制約違反を大幅に低減する。
論文 参考訳(メタデータ) (2026-03-16T11:28:47Z) - Beyond Hard Constraints: Budget-Conditioned Reachability For Safe Offline Reinforcement Learning [13.674504740468159]
安全到達性セットは、不安定なmin/maxやラグランジアン最適化を伴わずに、いかに安全制約を強制するかを示す。
また、このセットが不安定なmin/maxやラグランジアン最適化を使わずに、いかに安全性の制約を強制するかを示す。
本手法は,安全性を維持しつつ,アートベースラインの状態に適合または優れる。
論文 参考訳(メタデータ) (2026-03-08T11:09:33Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - How to Train Your Latent Control Barrier Function: Smooth Safety Filtering Under Hard-to-Model Constraints [21.03977709777739]
本研究では,可到達性値関数を制御障壁関数(CBF)に適応させることにより,最適化に基づくスムーズなフィルタリングを実現する。
本稿では,ラベル付けを伴わずにスムーズなマージン関数に繋がる勾配のペナルティによって,両方の課題に対処するLatentCBFを提案する。
視覚に基づく操作ポリシーによるシミュレーションベンチマークとハードウェアの実験は、LatentCBFがスムーズな安全フィルタリングを可能にすることを示した。
論文 参考訳(メタデータ) (2025-11-23T20:15:28Z) - Modular Control Architecture for Safe Marine Navigation: Reinforcement Learning and Predictive Safety Filters [0.0]
強化学習は複雑なシナリオに適応するためにますます使われていますが、安全性と安定性を保証するための標準フレームワークは欠如しています。
予測安全フィルタ(PSF)は、明示的な制約処理を伴わずに、学習ベースの制御における制約満足度を確保する、有望なソリューションを提供する。
この手法を海洋航法に適用し,シミュレーションされたCybership IIモデル上でRLとPSFを組み合わせた。
その結果, PSF が安全維持に有効であることは, RL エージェントの学習速度と性能を損なうことなく示され, PSF を使用せずに標準 RL エージェントに対して評価された。
論文 参考訳(メタデータ) (2023-12-04T12:37:54Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。