論文の概要: Robust Path Tracking for Vehicles via Continuous-Time Residual Learning: An ICODE-MPPI Approach
- arxiv url: http://arxiv.org/abs/2605.03260v1
- Date: Tue, 05 May 2026 01:20:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.705395
- Title: Robust Path Tracking for Vehicles via Continuous-Time Residual Learning: An ICODE-MPPI Approach
- Title(参考訳): 連続時間残差学習による車両のロバストパス追跡:ICODE-MPPIアプローチ
- Authors: Shugen Song, Wenjie Mei, Chengyan Zhao,
- Abstract要約: モデル予測経路積分(MPPI)制御は、非線形自律システムのための強力なサンプリングベースの戦略である。
本稿では、ICODE-MPPIを提案する。ICODE(Input Concomitant Ordinary Differential Equations)を用いて、モデルなし残差ダイナミクスの学習と補償を行う。
複素軌道上の高忠実度シミュレーションは、ICODE-MPPIが持続的乱れ下でのクロストラック誤差を最大69%減少させることを示した。
- 参考スコア(独自算出の注目度): 1.6567880228735359
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model Predictive Path Integral (MPPI) control is a powerful sampling-based strategy for nonlinear autonomous systems. However, its performance is often bottlenecked by the fidelity of nominal dynamics. We propose ICODE-MPPI, a robust framework that leverages Input Concomitant Neural Ordinary Differential Equations (ICODEs) to learn and compensate for unmodeled residual dynamics. Unlike discrete-time learners, ICODEs maintain physical consistency and temporal continuity during the MPPI prediction horizon. High-fidelity simulations on complex trajectories demonstrate that ICODE-MPPI achieves up to a 69\% reduction in cross-tracking error under persistent disturbances compared to standard MPPI control. Furthermore, our analysis confirms that ICODE-MPPI significantly suppresses control chattering, yielding smoother steering commands and superior robust performance.
- Abstract(参考訳): モデル予測パス積分(MPPI)制御は、非線形自律システムのための強力なサンプリングベースの戦略である。
しかし、その性能は名目力学の忠実さによってしばしばボトルネックとなる。
本稿では、ICODE-MPPIを提案する。ICODE(Input Concomitant Neural Ordinary Differential Equations)を用いて、モデルなし残差ダイナミクスの学習と補償を行う。
離散時間学習とは異なり、ICODEはMPPI予測の地平線における物理的一貫性と時間的連続性を維持する。
複素軌道上の高忠実度シミュレーションにより、ICODE-MPPIは、通常のMPPI制御と比較して、持続的乱れ下でのクロストラッキング誤差を最大で69%低減することを示した。
さらに, ICODE-MPPIは制御チャタリングを著しく抑制し, よりスムーズな操舵コマンドと頑健な性能が向上することを確認した。
関連論文リスト
- RAY-TOLD: Ray-Based Latent Dynamics for Dense Dynamic Obstacle Avoidance with TDMPC [5.838266102141284]
RAY-TOLDは、障害情報を潜在力学に統合するハイブリッド制御アーキテクチャである。
本稿では,MPPI候補人口を学習方針から派生した軌道で増加させる政策混合サンプリング戦略を提案する。
その結果、短時間の水平物理学に基づくロールアウトと学習された長い水平意図を組み合わせることで、ナビゲーションの信頼性と安全性が著しく向上することが確認された。
論文 参考訳(メタデータ) (2026-04-30T05:44:46Z) - A Flow Matching Framework for Soft-Robot Inverse Dynamics [13.045225329973617]
オープンループフィードフォワード制御のための逆力学フレームワークは、生成トランスポートマップとしてシステムの微分力学を学習する。
作業は、ソフトロボットシステムにおいて、微分逆ダイナミクスを学習するための堅牢で高性能なパラダイムとしてフローマッチングを実証する。
論文 参考訳(メタデータ) (2026-04-03T12:45:46Z) - Accelerating Sampling-Based Control via Learned Linear Koopman Dynamics [4.946483489399818]
本稿では、複雑な非線形力学を持つシステムに対する効率的なモデル予測経路積分(MPPI)制御フレームワークを提案する。
軌道伝播に使用される非線形ダイナミクスを学習された線形深度クープマン作用素(DKO)モデルに置き換え、より高速なロールアウトとより効率的な軌道サンプリングを可能にする。
コントローラはMPPI-DKと呼ばれ、四足歩行ロボットの基準追跡実験を通じてハードウェア上で検証される。
論文 参考訳(メタデータ) (2026-03-05T17:15:52Z) - When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift [64.37959940809633]
時間的持続的なセンサ故障下でのPPOのロバスト性について検討する。
トランスフォーマーを用いたシーケンスポリシーは, センサ数が少ない場合でも高いリターンを保ちながら, 堅牢性, RNN, SSMよりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-03-04T22:21:54Z) - DDP-WM: Disentangled Dynamics Prediction for Efficient World Models [79.53092337527382]
本稿では,DDP-WMについて紹介する。DDP-WMはDDP-WM(Distangled Dynamics Prediction)の原理に基づく新しい世界モデルである。
DDP-WMは、効率的な履歴処理と動的ローカライゼーションを統合したアーキテクチャにより、この分解を実現する。
実験により、DDP-WMは様々なタスクにおいて、大幅な効率と性能を達成することが示された。
論文 参考訳(メタデータ) (2026-02-02T08:04:25Z) - OMP: One-step Meanflow Policy with Directional Alignment [26.114675928221974]
高忠実でリアルタイムな操作のために設計されたワンステップ平均フローポリシー(OMP)。
AdroitとMeta-Worldベンチマークの実験では、OMPは成功率と軌道精度において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-12-22T12:45:35Z) - Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics [2.152586952462536]
本稿では, エコー状態ネットワーク (ESN) とモデル予測経路積分 (MPPI) の制御を統合し, 高速オンライン識別と未知のダイナミクスの制御の課題に対処する。
提案した貯水池予測経路積分(RPPI)は, ESNを用いた非線形力学の高速学習を可能にし, 並列化MPPI制御計算において, 学習された非線形性を直接活用する。
論文 参考訳(メタデータ) (2025-09-04T03:05:17Z) - Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。