論文の概要: Generalized Trajectory Scoring for End-to-end Multimodal Planning
- arxiv url: http://arxiv.org/abs/2506.06664v1
- Date: Sat, 07 Jun 2025 05:06:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.404807
- Title: Generalized Trajectory Scoring for End-to-end Multimodal Planning
- Title(参考訳): エンド・ツー・エンドマルチモーダル計画のための一般化軌道符号化
- Authors: Zhenxin Li, Wenhao Yao, Zi Wang, Xinglong Sun, Joshua Chen, Nadine Chang, Maying Shen, Zuxuan Wu, Shiyi Lan, Jose M. Alvarez,
- Abstract要約: Generalized Trajectory Scoring (GTRS)は、エンドツーエンドのマルチモーダル計画のための統合フレームワークである。
GTRSは,(1)多種多様な微細な提案を生成する拡散型軌跡生成装置,(2)高密度軌跡集合のスコアラをドロップアウト正規化で訓練する語彙一般化技術,(3)ドメイン外一般化を強化するセンサ増強戦略の3つの相補的なイノベーションで構成されている。
ナブシムv2チャレンジの勝利解として、GTRSは準最適センサ入力においても優れた性能を示す。
- 参考スコア(独自算出の注目度): 42.38746285135693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end multi-modal planning is a promising paradigm in autonomous driving, enabling decision-making with diverse trajectory candidates. A key component is a robust trajectory scorer capable of selecting the optimal trajectory from these candidates. While recent trajectory scorers focus on scoring either large sets of static trajectories or small sets of dynamically generated ones, both approaches face significant limitations in generalization. Static vocabularies provide effective coarse discretization but struggle to make fine-grained adaptation, while dynamic proposals offer detailed precision but fail to capture broader trajectory distributions. To overcome these challenges, we propose GTRS (Generalized Trajectory Scoring), a unified framework for end-to-end multi-modal planning that combines coarse and fine-grained trajectory evaluation. GTRS consists of three complementary innovations: (1) a diffusion-based trajectory generator that produces diverse fine-grained proposals; (2) a vocabulary generalization technique that trains a scorer on super-dense trajectory sets with dropout regularization, enabling its robust inference on smaller subsets; and (3) a sensor augmentation strategy that enhances out-of-domain generalization while incorporating refinement training for critical trajectory discrimination. As the winning solution of the Navsim v2 Challenge, GTRS demonstrates superior performance even with sub-optimal sensor inputs, approaching privileged methods that rely on ground-truth perception. Code will be available at https://github.com/NVlabs/GTRS.
- Abstract(参考訳): エンドツーエンドのマルチモーダル計画は、自律運転において有望なパラダイムであり、多様な軌道候補による意思決定を可能にする。
鍵となる構成要素は、これらの候補から最適な軌道を選択することのできる頑健な軌道スコアラである。
最近の軌道スコアラーは、大きな静的軌跡の集合か、動的に生成された小さな集合のどちらかをスコアリングすることに集中しているが、どちらのアプローチも一般化において重大な制限に直面している。
静的語彙は効果的な粗い離散化を提供するが、微粒化に苦慮する一方で、動的提案は詳細な精度を提供するが、より広い軌道分布を捉えることができない。
これらの課題を克服するために、粗い軌道評価ときめ細かい軌道評価を組み合わせた、エンドツーエンドのマルチモーダル計画のための統一的なフレームワークであるGTRS(Generalized Trajectory Scoring)を提案する。
GTRSは,(1)多種多様な微粒な提案を生成する拡散型軌跡生成装置,(2)高密度軌跡集合上でスコアラーをトレーニングする語彙一般化技術,(3)重要軌跡識別のための洗練訓練を取り入れつつ,領域外一般化を促進するセンサ増強戦略,の3つの相補的なイノベーションで構成されている。
ナブシムv2チャレンジの勝利解として、GTRSは、準最適センサー入力でも優れた性能を示し、地道的知覚に依存する特権的手法にアプローチする。
コードはhttps://github.com/NVlabs/GTRS.comで入手できる。
関連論文リスト
- DriveSuprim: Towards Precise Trajectory Selection for End-to-End Planning [43.284391163049236]
DriveSuprimは、自動運転車の軌道選択のための選択に基づくパラダイムである。
衝突回避や規則の遵守など、最先端のパフォーマンスを実現する。
様々な運転シナリオにおいて高い軌道品質を維持する。
論文 参考訳(メタデータ) (2025-06-07T04:39:06Z) - GUIDE-CoT: Goal-driven and User-Informed Dynamic Estimation for Pedestrian Trajectory using Chain-of-Thought [9.572859785331307]
GUIDE-CoT (Chain-of-Thought) を用いた歩行者軌跡のゴール駆動およびユーザインフォームド動的推定法を提案する。
提案手法は,(1)視覚的プロンプトと事前学習された視覚的エンコーダを組み合わせた目標予測精度を向上する目標指向視覚プロンプト,(2)軌道生成のためのチェーン・オブ・シント(CoT)LLM,の2つのイノベーティブなモジュールを統合する。
提案手法は,歩行者軌道予測における精度と適応性を両立させ,最先端性能を実現する。
論文 参考訳(メタデータ) (2025-03-10T01:39:24Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - Trajectory Prediction with Graph-based Dual-scale Context Fusion [43.51107329748957]
本稿では,Dual Scale Predictorというグラフベースの軌道予測ネットワークを提案する。
静的および動的駆動コンテキストを階層的にエンコードする。
提案したデュアルスケールコンテキスト融合ネットワークにより、DSPは正確で人間らしいマルチモーダル軌道を生成することができる。
論文 参考訳(メタデータ) (2021-11-02T13:42:16Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Autonomous Drone Racing with Deep Reinforcement Learning [39.757652701917166]
ドローンレースのような多くのロボットタスクにおいて、ゴールはできるだけ速くコースポイントを移動することである。
重要な課題は、事前に通過するウェイポイントの完全な知識を想定して解決される最小時間軌道を計画することです。
本研究では,クワッドロータの最小時間軌道生成法を提案する。
論文 参考訳(メタデータ) (2021-03-15T18:05:49Z) - Improving Movement Predictions of Traffic Actors in Bird's-Eye View
Models using GANs and Differentiable Trajectory Rasterization [12.652210024012374]
自動運転パズルの最も重要なピースの1つは、周囲の交通機関の将来の動きを予測するタスクである。
一方はトップダウンのシーン化と他方はGAN(Generative Adrial Networks)に基づく手法が特に成功したことが示されている。
本稿では,これら2つの方向に基づいて,Aversa-based conditional GANアーキテクチャを提案する。
提案手法を実世界の大規模データセット上で評価し,最先端のGANベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-04-14T00:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。