論文の概要: Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments
- arxiv url: http://arxiv.org/abs/2508.03428v1
- Date: Tue, 05 Aug 2025 13:17:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.976202
- Title: Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments
- Title(参考訳): 動的環境におけるMPCによる衝突回避のための残留神経終端制約
- Authors: Bojan Derajić, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Wolfgang Hönig,
- Abstract要約: 本稿では,学習に基づく安全集合の近似を用いたハイブリッドMPCローカルプランナを提案する。
我々は,HJ値関数が対応する符号距離関数(SDF)と非負残関数の差として表現できるという特性を利用する。
残余成分は、非負の出力を持つニューラルネットワークとしてモデル化され、計算されたSDFから減算され、結果として、設計上、SDFと同じくらい安全である実時間値関数の推定結果が得られる。
- 参考スコア(独自算出の注目度): 1.3182466374784207
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a hybrid MPC local planner that uses a learning-based approximation of a time-varying safe set, derived from local observations and applied as the MPC terminal constraint. This set can be represented as a zero-superlevel set of the value function computed via Hamilton-Jacobi (HJ) reachability analysis, which is infeasible in real-time. We exploit the property that the HJ value function can be expressed as a difference of the corresponding signed distance function (SDF) and a non-negative residual function. The residual component is modeled as a neural network with non-negative output and subtracted from the computed SDF, resulting in a real-time value function estimate that is at least as safe as the SDF by design. Additionally, we parametrize the neural residual by a hypernetwork to improve real-time performance and generalization properties. The proposed method is compared with three state-of-the-art methods in simulations and hardware experiments, achieving up to 30\% higher success rates compared to the best baseline while requiring a similar computational effort and producing high-quality (low travel-time) solutions.
- Abstract(参考訳): 本稿では,MPC端末の制約として,局所的な観測から導かれる時間変化セーフセットの学習に基づく近似を用いたハイブリッドMPCローカルプランナを提案する。
この集合は、ハミルトン・ヤコビ(HJ)リーチビリティ解析によって計算される値関数の零スーパーレベル集合として表すことができ、これはリアルタイムでは実現不可能である。
我々は,HJ値関数が対応する符号距離関数(SDF)と非負残関数の差として表現できるという特性を利用する。
残余成分は、非負の出力を持つニューラルネットワークとしてモデル化され、計算されたSDFから減算され、結果として、設計上、SDFと同じくらい安全である実時間値関数の推定結果が得られる。
さらに,ハイパーネットワークによるニューラル残差のパラメトリゼーションを行い,実時間性能と一般化特性を向上させる。
提案手法はシミュレーションおよびハードウェア実験における3つの最先端手法と比較し, 同様の計算作業を要し, 高品質(低走行時間)のソリューションを創出しながら, 最良ベースラインよりも最大30%高い成功率を達成する。
関連論文リスト
- LVM-GP: Uncertainty-Aware PDE Solver via coupling latent variable model and Gaussian process [9.576396359649921]
雑音データを用いたPDEの解法における不確実性定量化のための新しいフレームワーク LVM-GP を提案する。
アーキテクチャは信頼を意識したエンコーダと確率的デコーダで構成される。
論文 参考訳(メタデータ) (2025-07-30T09:00:39Z) - Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。
現在の最先端の成果を改善するために,3つの重要なコントリビューションを行います。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Energy-Based Model for Accurate Estimation of Shapley Values in Feature Attribution [7.378438977893025]
EmSHAP (Energy-based model for Shapley value Estimation) は、Shapleyコントリビューション関数の期待値を推定するために提案される。
GRU(Gated Recurrent Unit)結合分割関数推定法を提案する。
論文 参考訳(メタデータ) (2024-04-01T12:19:33Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium
Learning from Offline Datasets [101.5329678997916]
両プレイヤーゼロサムマルコフゲーム(MG)をオフライン環境で研究する。
目標は、事前収集されたデータセットに基づいて、近似的なナッシュ均衡(NE)ポリシーペアを見つけることである。
論文 参考訳(メタデータ) (2022-02-15T15:39:30Z) - Robust and Adaptive Temporal-Difference Learning Using An Ensemble of
Gaussian Processes [70.80716221080118]
本稿では、時間差学習(TD)による政策評価の世代的視点について考察する。
OS-GPTDアプローチは、状態-逆ペアのシーケンスを観測することにより、与えられたポリシーの値関数を推定するために開発された。
1つの固定カーネルに関連する限られた表現性を緩和するために、GP前の重み付けアンサンブル(E)を用いて代替のスキームを生成する。
論文 参考訳(メタデータ) (2021-12-01T23:15:09Z) - Probabilistic partition of unity networks: clustering based deep
approximation [0.0]
ユニタリネットワーク(POU-Nets)の分割は、回帰とPDEの解に対する代数収束率を実現することができる。
ガウス雑音モデルを用いてPOU-Netを拡張し、最大可算損失の勾配に基づく一般化を導出できる確率的一般化を得る。
本研究では,高次元・低次元での性能を定量化するためのベンチマークを行い,高次元空間内のデータの潜在次元にのみ依存することを示す。
論文 参考訳(メタデータ) (2021-07-07T08:02:00Z) - Local approximate Gaussian process regression for data-driven
constitutive laws: Development and comparison with neural networks [0.0]
局所近似過程回帰を用いて特定のひずみ空間における応力出力を予測する方法を示す。
FE設定におけるグローバル構造問題を解決する場合のlaGPR近似の局所的性質に適応するために、修正されたニュートン・ラフソン手法が提案される。
論文 参考訳(メタデータ) (2021-05-07T14:49:28Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。