論文の概要: TrajTok: Technical Report for 2025 Waymo Open Sim Agents Challenge
- arxiv url: http://arxiv.org/abs/2506.21618v1
- Date: Mon, 23 Jun 2025 08:32:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:22.929563
- Title: TrajTok: Technical Report for 2025 Waymo Open Sim Agents Challenge
- Title(参考訳): TrajTok:2025年のWaymo Open Sim Agents Challengeの技術レポート
- Authors: Zhiyuan Zhang, Xiaosong Jia, Guanyu Chen, Qifeng Li, Junchi Yan,
- Abstract要約: 本稿では、離散的な次トーケン予測に基づく行動生成モデルのためのトラジェクトリトークンであるTrajTokを紹介する。
我々は,SMARTモデルのトークン化と損失を採用し,2025年のオープン・シム・エージェント・チャレンジにおいて,リアリズムスコア0.7852の優れた性能を達成した。
- 参考スコア(独自算出の注目度): 58.952909068296314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this technical report, we introduce TrajTok, a trajectory tokenizer for discrete next-token-prediction based behavior generation models, which combines data-driven and rule-based methods with better coverage, symmetry and robustness, along with a spatial-aware label smoothing method for cross-entropy loss. We adopt the tokenizer and loss for the SMART model and reach a superior performance with realism score of 0.7852 on the Waymo Open Sim Agents Challenge 2025. We will open-source the code in the future.
- Abstract(参考訳): 本稿では,データ駆動型および規則に基づく手法と,より優れたカバレッジ,対称性,ロバスト性を組み合わせた,離散的次トーケン予測に基づく行動生成モデルのためのトラジェクタであるTrajTokと,クロスエントロピー損失のための空間認識ラベル平滑化手法を紹介する。
我々は、SMARTモデルのトークン化と損失を採用し、Waymo Open Sim Agents Challenge 2025において、リアリズムスコア0.7852の優れたパフォーマンスを達成する。
将来、コードをオープンソースにします。
関連論文リスト
- Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis [79.98107530577576]
DisConは、離散トークンを生成ターゲットではなく条件信号として再解釈する新しいフレームワークである。
DisConは、ImageNet 256$times $256 世代で gFID スコアが 1.38 に達し、最先端の自己回帰アプローチよりも明確なマージンで優れている。
論文 参考訳(メタデータ) (2025-07-02T14:33:52Z) - Transferable Adversarial Attacks on SAM and Its Downstream Models [87.23908485521439]
本稿では,セグメント・アプライス・モデル(SAM)から微調整した様々な下流モデルに対する敵攻撃の可能性について検討する。
未知のデータセットを微調整したモデルに対する敵攻撃の有効性を高めるために,ユニバーサルメタ初期化(UMI)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-26T15:04:04Z) - Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。
我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。
我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2~3倍の高速化を実現した。
論文 参考訳(メタデータ) (2024-07-22T18:00:00Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Model Predictive Simulation Using Structured Graphical Models and Transformers [4.229560419171488]
本稿では、トランスフォーマと確率的グラフィカルモデル(PGM)に基づいて、複数の対話エージェント(道路利用者)の軌跡をシミュレートする手法を提案する。
次に, 先行知識を符号化する因子を含むPGMを用いて, これらの軌道を改良する。
我々はMPSがMTRベースラインを改善することを示し、特に衝突速度などの安全クリティカルな指標について述べる。
論文 参考訳(メタデータ) (2024-06-28T03:46:53Z) - BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction [22.254486248785614]
BehaviorGPTは、複数のエージェントのシーケンシャルな振る舞いをシミュレートするために設計された、均一で完全な自己回帰変換器である。
本稿では,自己回帰モデルによる負の効果を軽減するために,Next-Patch Prediction Paradigm (NP3)を導入する。
ビヘイビアGPTは2024年のオープン・シム・エージェント・チャレンジで、リアリズムスコアが0.7473、ミナードスコアが1.4147で優勝した。
論文 参考訳(メタデータ) (2024-05-27T17:28:25Z) - SMART: Scalable Multi-agent Real-time Motion Generation via Next-token Prediction [4.318757942343036]
本稿では,ベクトル化された地図とエージェント軌跡データを離散的なシーケンストークンにモデル化する,新しい自律走行運動生成パラダイムを提案する。
これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、次のトークン予測タスクをトレーニングする。
複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証しました。
論文 参考訳(メタデータ) (2024-05-24T16:17:35Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Multiverse Transformer: 1st Place Solution for Waymo Open Sim Agents
Challenge 2023 [3.4520774137890555]
本報告では,オープン・シム・エージェント・チャレンジ(WOSAC)2023における第1位のソリューションについて述べる。
提案するMultiVerse Transformer for Agent Simulation (MVTA)は,トランスフォーマーに基づく動作予測手法を効果的に活用する。
本研究では,高度なリアリズムを持つシミュレーションを作成するために,新しいトレーニング手法とサンプリング手法を設計する。
論文 参考訳(メタデータ) (2023-06-20T20:01:07Z) - Generative Modeling through the Semi-dual Formulation of Unbalanced
Optimal Transport [9.980822222343921]
非平衡最適輸送(UOT)の半二重定式化に基づく新しい生成モデルを提案する。
OTとは異なり、UOTは分散マッチングの厳しい制約を緩和する。このアプローチは、外れ値に対する堅牢性、トレーニング中の安定性、より高速な収束を提供する。
CIFAR-10ではFIDスコアが2.97、CelebA-HQ-256では6.36である。
論文 参考訳(メタデータ) (2023-05-24T06:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。