Fugu-MT 論文翻訳(概要): SMART: Scalable Multi-agent Real-time Generation via Next-token Prediction

論文の概要: SMART: Scalable Multi-agent Real-time Generation via Next-token Prediction

arxiv url: http://arxiv.org/abs/2405.15677v2
Date: Tue, 29 Oct 2024 11:58:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:32.754787
Title: SMART: Scalable Multi-agent Real-time Generation via Next-token Prediction
Title（参考訳）: SMART:次世代予測によるスケーラブルマルチエージェントリアルタイム生成
Authors: Wei Wu, Xiaoxin Feng, Ziyan Gao, Yuheng Kan,
Abstract要約: 本稿では,ベクトル化された地図とエージェント軌跡データを離散的なシーケンストークンにモデル化する,新しい自律走行運動生成パラダイムを提案する。これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、次のトークン予測タスクをトレーニングする。複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証しました。
参考スコア（独自算出の注目度）: 4.318757942343036
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Data-driven autonomous driving motion generation tasks are frequently impacted by the limitations of dataset size and the domain gap between datasets, which precludes their extensive application in real-world scenarios. To address this issue, we introduce SMART, a novel autonomous driving motion generation paradigm that models vectorized map and agent trajectory data into discrete sequence tokens. These tokens are then processed through a decoder-only transformer architecture to train for the next token prediction task across spatial-temporal series. This GPT-style method allows the model to learn the motion distribution in real driving scenarios. SMART achieves state-of-the-art performance across most of the metrics on the generative Sim Agents challenge, ranking 1st on the leaderboards of Waymo Open Motion Dataset (WOMD), demonstrating remarkable inference speed. Moreover, SMART represents the generative model in the autonomous driving motion domain, exhibiting zero-shot generalization capabilities: Using only the NuPlan dataset for training and WOMD for validation, SMART achieved a competitive score of 0.72 on the Sim Agents challenge. Lastly, we have collected over 1 billion motion tokens from multiple datasets, validating the model's scalability. These results suggest that SMART has initially emulated two important properties: scalability and zero-shot generalization, and preliminarily meets the needs of large-scale real-time simulation applications. We have released all the code to promote the exploration of models for motion generation in the autonomous driving field. The source code is available at https://github.com/rainmaker22/SMART.
Abstract（参考訳）: データ駆動の自律走行運動生成タスクは、データセットサイズとデータセット間のドメインギャップの制限によって頻繁に影響を受ける。この問題に対処するために,ベクトル化マップとエージェントトラジェクトリデータを離散シーケンストークンにモデル化する,新しい自律走行運動生成パラダイムSMARTを導入する。これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、空間的時系列にわたって次のトークン予測タスクをトレーニングする。このGPTスタイルの手法により,実走行シナリオにおける運動分布を学習することができる。 SMARTは、生成するSim Agentsチャレンジのほとんどのメトリクスで最先端のパフォーマンスを達成し、Waymo Open Motion Dataset(WOMD)のリーダーボードで1位にランクインし、驚くべき推論速度を示している。さらに、SMARTは自律走行運動領域における生成モデルを表し、ゼロショットの一般化能力を示す:訓練にはNuPlanデータセットのみを使用し、検証にはWOMDを使用すると、Sim Agentsチャレンジでは0.72の競争スコアを達成した。最後に、複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証する。これらの結果は,SMARTが当初,スケーラビリティとゼロショットの一般化という2つの重要な特性をエミュレートしたことを示唆している。我々は、自律運転分野における運動生成モデル探索を促進するために、すべてのコードをリリースした。ソースコードはhttps://github.com/rainmaker22/SMARTで公開されている。

関連論文リスト

M-STAR: Multi-Scale Spatiotemporal Autoregression for Human Mobility Modeling [16.41018877188885]
本研究では,多段階時空間自動回帰(M-STAR)を提案する。 M-STARは、モビリティパターンをエンコードするマルチスケール時空間トケナイザと、トランスフォーマーベースのデコーダを組み合わせて、次のスケールの自己回帰予測を行う。
論文参考訳（メタデータ） (2025-12-08T08:57:55Z)
Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。 Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文参考訳（メタデータ） (2025-10-27T03:52:45Z)
Advancing Multi-agent Traffic Simulation via R1-Style Reinforcement Fine-Tuning [35.83999932977034]
エージェントの振る舞いを人間の好みや評価指標とよりよく整合させるため,次世代の予測モデルに適した新しいR1型強化微調整パラダイムを提案する。提案手法では、分布アライメントを改善するためのメトリック指向ポリシー最適化アルゴリズムと、スーパービジョンファインチューニング(SFT)と強化ファインチューニング(RFT)を交互に行う反復的な"SFT-RFT-SFT"トレーニング戦略を導入する。 Open Sim Agents Challengeの結果、SMART-R1は総合リアリズムメタスコア0.7858で最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2025-09-28T17:36:13Z)
InfGen: Scenario Generation as Next Token Group Prediction [49.54222089551598]
InfGenは、エージェント状態とトラジェクトリを自動回帰的に出力するシナリオ生成フレームワークである。実験により、InfGenは現実的で多様性があり、適応的な交通行動を生み出すことが示された。
論文参考訳（メタデータ） (2025-06-29T16:18:32Z)
Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
マルチエージェントインタラクションをキャプチャする実世界のモーションプランニングベンチマークであるnuPlanを提案する。我々は、グラフ畳み込みニューラルネットワーク(GCNN)であるBehaviorNetを用いて、このようなユニークな振る舞いをモデル化することを学ぶ。また、モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverについても紹介する。
論文参考訳（メタデータ） (2024-06-15T18:53:45Z)
Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文参考訳（メタデータ） (2024-05-27T22:15:23Z)
BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction [22.254486248785614]
BehaviorGPTは、複数のエージェントのシーケンシャルな振る舞いをシミュレートするために設計された、均一で完全な自己回帰変換器である。本稿では,自己回帰モデルによる負の効果を軽減するために,Next-Patch Prediction Paradigm (NP3)を導入する。ビヘイビアGPTは2024年のオープン・シム・エージェント・チャレンジで、リアリズムスコアが0.7473、ミナードスコアが1.4147で優勝した。
論文参考訳（メタデータ） (2024-05-27T17:28:25Z)
Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文参考訳（メタデータ） (2023-12-07T18:53:27Z)
Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。 TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文参考訳（メタデータ） (2023-10-12T20:49:15Z)
FollowNet: A Comprehensive Benchmark for Car-Following Behavior Modeling [20.784555362703294]
自動車追従行動モデリングのための公開ベンチマークデータセットを構築した。ベンチマークは、5つの公共運転データセットから抽出された80K以上のカーフォローイベントで構成されている。以上の結果から, DDPGに基づくモデルでは, 間隔の低いMSEと競合する結果が得られた。
論文参考訳（メタデータ） (2023-05-25T08:59:26Z)
TrafficBots: Towards World Models for Autonomous Driving Simulation and Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文参考訳（メタデータ） (2023-03-07T18:28:41Z)
Joint Spatial-Temporal and Appearance Modeling with Transformer for Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文参考訳（メタデータ） (2022-05-31T01:19:18Z)
A Driving Behavior Recognition Model with Bi-LSTM and Multi-Scale CNN [59.57221522897815]
運転行動認識のための軌道情報に基づくニューラルネットワークモデルを提案する。提案手法を公開BLVDデータセット上で評価し,満足な性能を実現する。
論文参考訳（メタデータ） (2021-03-01T06:47:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。