論文の概要: Receding-Horizon Control via Drifting Models
- arxiv url: http://arxiv.org/abs/2604.04528v1
- Date: Mon, 06 Apr 2026 08:48:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.150729
- Title: Receding-Horizon Control via Drifting Models
- Title(参考訳): ドリフトモデルによる回帰水平制御
- Authors: Daniele Foffano, Alessio Russo, Alexandre Proutiere,
- Abstract要約: ドリフトMPCは、ドリフト生成モデルと未知の力学の下での後退水平計画を組み合わせた。
ドリフトMPCはドリフトモデルの一段階推論効率を維持しつつ, ほぼ最適軌道を生成可能であることを示す。
- 参考スコア(独自算出の注目度): 46.44328012099217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of trajectory optimization in settings where the system dynamics are unknown and it is not possible to simulate trajectories through a surrogate model. When an offline dataset of trajectories is available, an agent could directly learn a trajectory generator by distribution matching. However, this approach only recovers the behavior distribution in the dataset, and does not in general produce a model that minimizes a desired cost criterion. In this work, we propose Drifting MPC, an offline trajectory optimization framework that combines drifting generative models with receding-horizon planning under unknown dynamics. The goal of Drifting MPC is to learn, from an offline dataset of trajectories, a conditional distribution over trajectories that is both supported by the data and biased toward optimal plans. We show that the resulting distribution learned by Drifting MPC is the unique solution of an objective that trades off optimality with closeness to the offline prior. Empirically, we show that Drifting MPC can generate near-optimal trajectories while retaining the one-step inference efficiency of drifting models and substantially reducing generation time relative to diffusion-based baselines.
- Abstract(参考訳): 本研究では,システムダイナミクスが不明な環境での軌道最適化の問題について検討し,サロゲートモデルによる軌道のシミュレートは不可能である。
オフラインのトラジェクトリデータセットが利用可能であれば、エージェントは分散マッチングによって、直接トラジェクトリジェネレータを学習することができる。
しかし、このアプローチはデータセットの振る舞い分布を回復するだけであり、一般的には望ましいコスト基準を最小化するモデルを生成しない。
本研究では、ドリフト生成モデルと未知の動的条件下での後退水平計画を組み合わせたオフライン軌道最適化フレームワークDrifting MPCを提案する。
Drifting MPCの目標は、トラジェクトリのオフラインデータセットから学習することである。
ドリフトMPCによって得られた分布は、最適性とオフライン前の近接性とを交換する目的のユニークな解であることを示す。
実験により,ドリフトMPCはドリフトモデルの一段階推論効率を維持しつつほぼ最適軌道を生成でき,拡散ベースベースラインに対する生成時間を著しく短縮できることを示す。
関連論文リスト
- HAD: Combining Hierarchical Diffusion with Metric-Decoupled RL for End-to-End Driving [51.268878540511054]
我々は階層的拡散政策を備えたエンドツーエンドの計画フレームワークであるHADを提案する。
我々は,NAVSIMとHUGSIMの両方でHADが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-04T04:12:47Z) - Amortizing Trajectory Diffusion with Keyed Drift Fields [2.5352713493505785]
キード・ドリフト・ポリシーズ (Keyed Drifting Policies) は、ドリフトフィールドの目標で訓練された1ステップの軌道生成装置である。
生成されたトラジェクトリを条件マッチングされたデータセットウィンドウに反映する。
1ステップの推論で高い性能を達成し、拡散サンプリングよりも計画遅延を大幅に低減する。
論文 参考訳(メタデータ) (2026-03-14T17:56:15Z) - The Offline-Frontier Shift: Diagnosing Distributional Limits in Generative Multi-Objective Optimization [56.39938641873341]
生成法は, 世代間距離などの他の指標に対して, 進化的オルタナティブを系統的に過小評価することを示す。
この制限を克服するには、客観空間における分配外サンプリングが必要であると論じる。
本研究は, オフラインMOOを分散シフト制限問題として位置づけ, 生成最適化手法が失敗する原因と原因を理解するための診断レンズを提供する。
論文 参考訳(メタデータ) (2026-02-11T18:38:40Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。
近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。
我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.49868273653921]
拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。
最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。
提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文 参考訳(メタデータ) (2024-08-01T17:59:59Z) - Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models [54.132297393662654]
本稿では,RLによる報酬モデルの最適化により,最先端拡散モデルを微調整するハイブリッド手法を提案する。
我々は、報酬モデルの補間能力を活用し、オフラインデータにおいて最良の設計を上回るアプローチの能力を実証する。
論文 参考訳(メタデータ) (2024-05-30T03:57:29Z) - STGlow: A Flow-based Generative Framework with Dual Graphormer for
Pedestrian Trajectory Prediction [22.553356096143734]
歩行者軌跡予測(STGlow)のための二重グラフマーを用いた新しい生成フローベースフレームワークを提案する。
本手法は,動作の正確なログライクな振る舞いを最適化することにより,基礎となるデータ分布をより正確にモデル化することができる。
いくつかのベンチマークによる実験結果から,本手法は従来の最先端手法に比べて性能が向上することが示された。
論文 参考訳(メタデータ) (2022-11-21T07:29:24Z) - Model-based Policy Optimization with Unsupervised Model Adaptation [37.09948645461043]
本研究では,不正確なモデル推定による実データとシミュレーションデータのギャップを埋めて,より良いポリシ最適化を実現する方法について検討する。
本稿では,教師なしモデル適応を導入したモデルベース強化学習フレームワークAMPOを提案する。
提案手法は,一連の連続制御ベンチマークタスクにおけるサンプル効率の観点から,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-10-19T14:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。