論文の概要: Imitative Planning using Conditional Normalizing Flow
- arxiv url: http://arxiv.org/abs/2007.16162v3
- Date: Thu, 13 Oct 2022 16:07:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 06:12:41.088340
- Title: Imitative Planning using Conditional Normalizing Flow
- Title(参考訳): 条件付き正規化流を用いたイミティブプランニング
- Authors: Shubhankar Agarwal, Harshit Sikchi, Cole Gulino, Eric Wilkinson and
Shivam Gautam
- Abstract要約: 自律走行車のための動的な都市シナリオにおける軌道計画の一般的な方法は、明確に特定され手作業によるコスト関数に依存することである。
自律走行車(AV)の軌道計画性能向上のための正規化フローの適用について検討する。
軌道プランナーのコスト多様体をエネルギー関数としてモデル化することにより、AV制御空間上のボルツマン分布以前のシーン条件付き写像を学習する。
- 参考スコア(独自算出の注目度): 2.8978926857710263
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A popular way to plan trajectories in dynamic urban scenarios for Autonomous
Vehicles is to rely on explicitly specified and hand crafted cost functions,
coupled with random sampling in the trajectory space to find the minimum cost
trajectory. Such methods require a high number of samples to find a low-cost
trajectory and might end up with a highly suboptimal trajectory given the
planning time budget. We explore the application of normalizing flows for
improving the performance of trajectory planning for autonomous vehicles (AVs).
Our key insight is to learn a sampling policy in a low-dimensional latent space
of expert-like trajectories, out of which the best sample is selected for
execution. By modeling the trajectory planner's cost manifold as an energy
function, we learn a scene conditioned mapping from the prior to a Boltzmann
distribution over the AV control space. Finally, we demonstrate the
effectiveness of our approach on real-world datasets over IL and
hand-constructed trajectory sampling techniques.
- Abstract(参考訳): 自律走行車のための動的都市シナリオにおける軌道計画の一般的な方法は、特定された手作業のコスト関数と軌道空間におけるランダムサンプリングに頼って最小のコスト軌道を求めることである。
このような手法では、低コストの軌道を見つけるのに大量のサンプルを必要とし、計画時間予算を考えると、非常に最適な軌道になる可能性がある。
自律走行車(AV)の軌道計画性能向上のための正規化フローの適用について検討する。
我々の重要な洞察は、専門家のような軌道の低次元潜在空間でサンプリングポリシーを学ぶことである。
軌道計画者のコスト多様体をエネルギー関数としてモデル化することにより,av制御空間上のボルツマン分布以前のシーン条件付きマッピングを学習する。
最後に,ilおよびハンドコンストラクテッド・トラックサンプリング手法を用いた実世界のデータセットに対するアプローチの有効性を実証する。
関連論文リスト
- Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - TrajDiffuse: A Conditional Diffusion Model for Environment-Aware Trajectory Prediction [16.188078087197106]
本稿では,新しい条件付き拡散モデルを用いた計画に基づく軌道予測手法であるTrajDiffuseを提案する。
本研究では, 軌道予測問題を不特定課題として定式化し, 拡散過程の地図に基づくガイダンス項を設計する。
TrajDiffuseは、環境制約にほぼ完全に準拠しながら、SOTAの正確さと多様性を一致または超過する軌道予測を生成することができる。
論文 参考訳(メタデータ) (2024-10-14T17:59:03Z) - Rocket Landing Control with Grid Fins and Path-following using MPC [0.0]
目的は、異なる技術を用いて着陸過程における総燃料消費量を最小化することである。
バッチ手法を用いて最適かつ実現可能な軌道が生成されると、モデル予測制御(MPC)に基づくアルゴリズムを用いて経路を辿ろうとする。
モデルミスマッチと異なる初期状態の下で,TOPEDは実演軌道をうまく追従できることを示す。
論文 参考訳(メタデータ) (2024-05-25T11:42:29Z) - D-Cubed: Latent Diffusion Trajectory Optimisation for Dexterous Deformable Manipulation [15.680133621889809]
D-Cubedは、タスクに依存しないプレイデータセットからトレーニングされた潜在拡散モデル(LDM)を用いた、新しい軌道最適化手法である。
我々は、D-Cubedが従来の軌道最適化および競争ベースラインアプローチをかなりの差で上回ることを示した。
論文 参考訳(メタデータ) (2024-03-19T16:05:51Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - DDPEN: Trajectory Optimisation With Sub Goal Generation Model [70.36888514074022]
本稿では,エスケープネットワークを用いた微分動的プログラミング(DDPEN)を提案する。
本稿では,環境の入力マップとして,所望の位置とともにコストマップの形で利用する深層モデルを提案する。
このモデルは、目標に導く可能性のある将来の方向を生成し、リアルタイムに実行可能なローカルなミニマを避ける。
論文 参考訳(メタデータ) (2023-01-18T11:02:06Z) - Learning Space Partitions for Path Planning [54.475949279050596]
PlaLaMは2次元ナビゲーションタスクにおける既存の経路計画手法よりも優れており、特に難解な局所最適化の存在下では優れている。
これらは高マルチモーダルな実世界のタスクに移行し、コンパイラフェーズでは最大245%、分子設計では最大0.4の強いベースラインを0-1スケールで上回ります。
論文 参考訳(メタデータ) (2021-06-19T18:06:11Z) - Autonomous Drone Racing with Deep Reinforcement Learning [39.757652701917166]
ドローンレースのような多くのロボットタスクにおいて、ゴールはできるだけ速くコースポイントを移動することである。
重要な課題は、事前に通過するウェイポイントの完全な知識を想定して解決される最小時間軌道を計画することです。
本研究では,クワッドロータの最小時間軌道生成法を提案する。
論文 参考訳(メタデータ) (2021-03-15T18:05:49Z) - End-to-end Interpretable Neural Motion Planner [78.69295676456085]
複雑な都市環境での自律走行学習のためのニューラルモーションプランナー(NMP)を提案する。
我々は,生lidarデータとhdマップを入力とし,解釈可能な中間表現を生成する全体モデルを設計した。
北米のいくつかの都市で収集された実世界の運転データにおける我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-01-17T14:16:12Z) - Diverse Sampling for Normalizing Flow Based Trajectory Forecasting [34.01303881881315]
本研究では,事前学習フローモデルからトラジェクトリサンプルの品質と多様性を向上させるため,DSF(Diversity Smpling for Flow)を提案する。
DSFは実装が容易であり、既存のフローベースの予測モデルに対して、シンプルなプラグインの改善を提供する。
論文 参考訳(メタデータ) (2020-11-30T18:23:29Z) - Path Planning Followed by Kinodynamic Smoothing for Multirotor Aerial
Vehicles (MAVs) [61.94975011711275]
そこで本稿では,RRT*textquotedblrightのテキストを幾何学的にベースとした動き計画手法を提案する。
提案手法では,適応探索空間とステアリング機能を導入したオリジナルのRT*を改良した。
提案手法を様々なシミュレーション環境で検証した。
論文 参考訳(メタデータ) (2020-08-29T09:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。