論文の概要: Generalizing Motion Planners with Mixture of Experts for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2410.15774v2
- Date: Tue, 29 Oct 2024 05:35:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:36:34.016626
- Title: Generalizing Motion Planners with Mixture of Experts for Autonomous Driving
- Title(参考訳): 自律運転の専門家の混在による運動プランナの一般化
- Authors: Qiao Sun, Huimin Wang, Jiahao Zhan, Fan Nie, Xin Wen, Leimeng Xu, Kun Zhan, Peng Jia, Xianpeng Lang, Hang Zhao,
- Abstract要約: State Transformer-2は拡張性のあるデコーダのみのモーションプランナで、ViTエンコーダとMoE(Mix-of-experts)因果トランスフォーマーアーキテクチャを使用している。
我々は、ViTエンコーダとMix-of-experts(MoE)因果変換アーキテクチャを用いたスケーラブルでデコーダのみのモーションプランナであるStateTransformer-2(STR2)を紹介する。
- 参考スコア(独自算出の注目度): 38.02032312602382
- License:
- Abstract: Large real-world driving datasets have sparked significant research into various aspects of data-driven motion planners for autonomous driving. These include data augmentation, model architecture, reward design, training strategies, and planner pipelines. These planners promise better generalizations on complicated and few-shot cases than previous methods. However, experiment results show that many of these approaches produce limited generalization abilities in planning performance due to overly complex designs or training paradigms. In this paper, we review and benchmark previous methods focusing on generalizations. The experimental results indicate that as models are appropriately scaled, many design elements become redundant. We introduce StateTransformer-2 (STR2), a scalable, decoder-only motion planner that uses a Vision Transformer (ViT) encoder and a mixture-of-experts (MoE) causal Transformer architecture. The MoE backbone addresses modality collapse and reward balancing by expert routing during training. Extensive experiments on the NuPlan dataset show that our method generalizes better than previous approaches across different test sets and closed-loop simulations. Furthermore, we assess its scalability on billions of real-world urban driving scenarios, demonstrating consistent accuracy improvements as both data and model size grow.
- Abstract(参考訳): 大規模な実世界の運転データセットは、自律運転のためのデータ駆動型モーションプランナーのさまざまな側面に関する重要な研究を引き起こしている。
これにはデータ拡張、モデルアーキテクチャ、報酬設計、トレーニング戦略、プランナーパイプラインが含まれる。
これらのプランナーは、従来の方法よりも複雑で少数ショットのケースでのより優れた一般化を約束する。
しかし,実験結果から,これらの手法の多くは,過度に複雑な設計や訓練パラダイムによる計画性能の一般化能力に限界があることが示されている。
本稿では,一般化に着目した従来の手法をレビューし,ベンチマークする。
実験結果は,モデルが適切にスケールされるにつれて,多くの設計要素が冗長になることを示している。
我々は、ViTエンコーダとMix-of-experts(MoE)因果変換アーキテクチャを用いたスケーラブルでデコーダのみのモーションプランナであるStateTransformer-2(STR2)を紹介する。
MoEバックボーンはトレーニング中に専門家のルーティングによってモダリティの崩壊と報酬バランスに対処する。
NuPlanデータセットの大規模な実験により、我々の手法は異なるテストセットとクローズドループシミュレーションにまたがる以前の手法よりも一般化されていることが示された。
さらに、実際の都市走行シナリオの数十億のスケーラビリティを評価し、データとモデルのサイズが大きくなるにつれて、一貫した精度の向上を実証する。
関連論文リスト
- Unveil Benign Overfitting for Transformer in Vision: Training Dynamics, Convergence, and Generalization [88.5582111768376]
本研究では, ソフトマックスを用いた自己保持層と, 勾配勾配下での完全連結層からなるトランスフォーマーの最適化について検討した。
この結果から,データモデルにおける信号対雑音比に基づいて,小さなテストエラー位相と大規模なテストエラー状態とを区別できるシャープ条件を確立した。
論文 参考訳(メタデータ) (2024-09-28T13:24:11Z) - TrackFormers: In Search of Transformer-Based Particle Tracking for the High-Luminosity LHC Era [2.9052912091435923]
高エネルギー物理実験は、新しいイテレーション毎に複数倍のデータの増加に直面している。
このようなオーバーホールが必要なステップの1つは、粒子トラックの再構築、すなわち追跡のタスクである。
機械学習支援ソリューションは、大幅な改善が期待されている。
論文 参考訳(メタデータ) (2024-07-09T18:47:25Z) - Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
運動プランナー(MP)は複雑な都市環境における安全なナビゲーションに不可欠である。
最近リリースされたMPベンチマークであるnuPlanは、クローズドループシミュレーションロジックで現実世界の駆動ログを拡張することで、この制限に対処している。
本稿では,モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverを提案する。
論文 参考訳(メタデータ) (2024-06-15T18:53:45Z) - AMEND: A Mixture of Experts Framework for Long-tailed Trajectory Prediction [6.724750970258851]
軌道予測のためのモジュラーモデル非依存フレームワークを提案する。
各専門家は、データの特定の部分に関して、特別なスキルで訓練される。
予測のために,相対的信頼スコアを生成することで,最高の専門家を選択するルータネットワークを利用する。
論文 参考訳(メタデータ) (2024-02-13T02:43:41Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Leveraging the Power of Data Augmentation for Transformer-based Tracking [64.46371987827312]
トラッキング用にカスタマイズされた2つのデータ拡張手法を提案する。
まず、動的探索半径機構と境界サンプルのシミュレーションにより、既存のランダムトリミングを最適化する。
第2に,背景干渉などの問題に対するモデルを可能にする,トークンレベルの機能混在強化戦略を提案する。
論文 参考訳(メタデータ) (2023-09-15T09:18:54Z) - Emergent Agentic Transformer from Chain of Hindsight Experience [96.56164427726203]
簡単なトランスフォーマーベースモデルが時間差と模倣学習に基づくアプローチの両方と競合することを示す。
単純なトランスフォーマーベースのモデルが時間差と模倣学習ベースのアプローチの両方で競合するのはこれが初めてである。
論文 参考訳(メタデータ) (2023-05-26T00:43:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。