論文の概要: SMART: Scalable Multi-agent Real-time Generation via Next-token Prediction
- arxiv url: http://arxiv.org/abs/2405.15677v2
- Date: Tue, 29 Oct 2024 11:58:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 20:19:31.541087
- Title: SMART: Scalable Multi-agent Real-time Generation via Next-token Prediction
- Title(参考訳): SMART:次世代予測によるスケーラブルマルチエージェントリアルタイム生成
- Authors: Wei Wu, Xiaoxin Feng, Ziyan Gao, Yuheng Kan,
- Abstract要約: 本稿では,ベクトル化された地図とエージェント軌跡データを離散的なシーケンストークンにモデル化する,新しい自律走行運動生成パラダイムを提案する。
これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、次のトークン予測タスクをトレーニングする。
複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証しました。
- 参考スコア(独自算出の注目度): 4.318757942343036
- License:
- Abstract: Data-driven autonomous driving motion generation tasks are frequently impacted by the limitations of dataset size and the domain gap between datasets, which precludes their extensive application in real-world scenarios. To address this issue, we introduce SMART, a novel autonomous driving motion generation paradigm that models vectorized map and agent trajectory data into discrete sequence tokens. These tokens are then processed through a decoder-only transformer architecture to train for the next token prediction task across spatial-temporal series. This GPT-style method allows the model to learn the motion distribution in real driving scenarios. SMART achieves state-of-the-art performance across most of the metrics on the generative Sim Agents challenge, ranking 1st on the leaderboards of Waymo Open Motion Dataset (WOMD), demonstrating remarkable inference speed. Moreover, SMART represents the generative model in the autonomous driving motion domain, exhibiting zero-shot generalization capabilities: Using only the NuPlan dataset for training and WOMD for validation, SMART achieved a competitive score of 0.72 on the Sim Agents challenge. Lastly, we have collected over 1 billion motion tokens from multiple datasets, validating the model's scalability. These results suggest that SMART has initially emulated two important properties: scalability and zero-shot generalization, and preliminarily meets the needs of large-scale real-time simulation applications. We have released all the code to promote the exploration of models for motion generation in the autonomous driving field. The source code is available at https://github.com/rainmaker22/SMART.
- Abstract(参考訳): データ駆動の自律走行運動生成タスクは、データセットサイズとデータセット間のドメインギャップの制限によって頻繁に影響を受ける。
この問題に対処するために,ベクトル化マップとエージェントトラジェクトリデータを離散シーケンストークンにモデル化する,新しい自律走行運動生成パラダイムSMARTを導入する。
これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、空間的時系列にわたって次のトークン予測タスクをトレーニングする。
このGPTスタイルの手法により,実走行シナリオにおける運動分布を学習することができる。
SMARTは、生成するSim Agentsチャレンジのほとんどのメトリクスで最先端のパフォーマンスを達成し、Waymo Open Motion Dataset(WOMD)のリーダーボードで1位にランクインし、驚くべき推論速度を示している。
さらに、SMARTは自律走行運動領域における生成モデルを表し、ゼロショットの一般化能力を示す:訓練にはNuPlanデータセットのみを使用し、検証にはWOMDを使用すると、Sim Agentsチャレンジでは0.72の競争スコアを達成した。
最後に、複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証する。
これらの結果は,SMARTが当初,スケーラビリティとゼロショットの一般化という2つの重要な特性をエミュレートしたことを示唆している。
我々は、自律運転分野における運動生成モデル探索を促進するために、すべてのコードをリリースした。
ソースコードはhttps://github.com/rainmaker22/SMARTで公開されている。
関連論文リスト
- Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。
バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z) - BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction [22.254486248785614]
Behavior Generative Pre-trained Transformers (BehaviorGPT) は、複数のエージェントのシーケンシャル動作をシミュレートするために設計されたデコーダのみの自己回帰型アーキテクチャである。
Next-Patch Prediction Paradigm (NP3) は、モデルが軌道のパッチレベルを推論し、長距離空間と時間的相互作用をキャプチャすることを可能にする。
BehaviorGPTはSim Agents Benchmarkでいくつかの指標にランクインし、マルチエージェントとエージェントマップのインタラクションにおいて、例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-05-27T17:28:25Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - FollowNet: A Comprehensive Benchmark for Car-Following Behavior Modeling [20.784555362703294]
自動車追従行動モデリングのための公開ベンチマークデータセットを構築した。
ベンチマークは、5つの公共運転データセットから抽出された80K以上のカーフォローイベントで構成されている。
以上の結果から, DDPGに基づくモデルでは, 間隔の低いMSEと競合する結果が得られた。
論文 参考訳(メタデータ) (2023-05-25T08:59:26Z) - TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - A Driving Behavior Recognition Model with Bi-LSTM and Multi-Scale CNN [59.57221522897815]
運転行動認識のための軌道情報に基づくニューラルネットワークモデルを提案する。
提案手法を公開BLVDデータセット上で評価し,満足な性能を実現する。
論文 参考訳(メタデータ) (2021-03-01T06:47:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。