論文の概要: MotionLM: Multi-Agent Motion Forecasting as Language Modeling
- arxiv url: http://arxiv.org/abs/2309.16534v1
- Date: Thu, 28 Sep 2023 15:46:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-29 13:47:30.146873
- Title: MotionLM: Multi-Agent Motion Forecasting as Language Modeling
- Title(参考訳): MotionLM: 言語モデリングとしてのマルチエージェントモーション予測
- Authors: Ari Seff, Brian Cera, Dian Chen, Mason Ng, Aurick Zhou, Nigamaa
Nayakanti, Khaled S. Refaat, Rami Al-Rfou, Benjamin Sapp
- Abstract要約: マルチエージェント動作予測のための言語モデルであるMotionLMを提案する。
本手法は,対話的なスコアリングに先立って個々のエージェントの軌道生成を行う,ポストホック相互作用をバイパスする。
モデルの逐次分解は、時間的因果条件のロールアウトを可能にする。
- 参考スコア(独自算出の注目度): 15.317827804763699
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable forecasting of the future behavior of road agents is a critical
component to safe planning in autonomous vehicles. Here, we represent
continuous trajectories as sequences of discrete motion tokens and cast
multi-agent motion prediction as a language modeling task over this domain. Our
model, MotionLM, provides several advantages: First, it does not require
anchors or explicit latent variable optimization to learn multimodal
distributions. Instead, we leverage a single standard language modeling
objective, maximizing the average log probability over sequence tokens. Second,
our approach bypasses post-hoc interaction heuristics where individual agent
trajectory generation is conducted prior to interactive scoring. Instead,
MotionLM produces joint distributions over interactive agent futures in a
single autoregressive decoding process. In addition, the model's sequential
factorization enables temporally causal conditional rollouts. The proposed
approach establishes new state-of-the-art performance for multi-agent motion
prediction on the Waymo Open Motion Dataset, ranking 1st on the interactive
challenge leaderboard.
- Abstract(参考訳): 道路エージェントの将来行動の信頼性予測は、自動運転車の安全計画にとって重要な要素である。
ここでは,連続的軌跡を離散的動きトークンの列として表現し,この領域上の言語モデリングタスクとしてマルチエージェント動き予測をキャストする。
まず、マルチモーダル分布を学習するために、アンカーや明示的な潜在変数最適化を必要としない。
代わりに、単一の標準言語モデリング目標を活用し、シーケンストークンの平均ログ確率を最大化する。
第2に,対話的スコアリングに先立ち,個々のエージェントの軌跡生成を行うポストホックなインタラクションヒューリスティックスをバイパスする手法である。
代わりに、MotionLMは単一の自己回帰復号プロセスで対話的なエージェント先物に対する共同分布を生成する。
さらに、モデルの逐次分解は、時間的因果条件付きロールアウトを可能にする。
提案手法は,waymoオープンモーションデータセットにおけるマルチエージェント動作予測のための新たな最先端性能を確立し,インタラクティブ・チャレンジ・リーダーボードでランキング1位となった。
関連論文リスト
- Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - SceneDM: Scene-level Multi-agent Trajectory Generation with Consistent
Diffusion Models [10.057312592344507]
本研究では,SceneDMと呼ばれる拡散モデルに基づく新しいフレームワークを提案する。
SceneDMはSim Agents Benchmarkで最先端の結果を得る。
論文 参考訳(メタデータ) (2023-11-27T11:39:27Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - MotionDiffuser: Controllable Multi-Agent Motion Prediction using
Diffusion [15.146808801331774]
MotionDiffuserは、複数のエージェント上での将来の軌跡の連成分布の拡散に基づく表現である。
そこで本稿では,コスト関数の相違に基づくトラジェクトリサンプリングを可能にする汎用的な制約付きサンプリングフレームワークを提案する。
我々は,Open Motionデータセット上でのマルチエージェント動作予測の最先端結果を得る。
論文 参考訳(メタデータ) (2023-06-05T17:55:52Z) - JFP: Joint Future Prediction with Interactive Multi-Agent Modeling for
Autonomous Driving [12.460224193998362]
構造化されたグラフィカルモデルの定式化において,エージェント同士の相互作用を直接学習するエンド・ツー・エンドのトレーニング可能なモデルを提案する。
提案手法は,単エージェントトラジェクタのトラジェクタとトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタの性能を向上する。
論文 参考訳(メタデータ) (2022-12-16T20:59:21Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - Weakly-supervised Action Transition Learning for Stochastic Human Motion
Prediction [81.94175022575966]
動作駆動型人間の動作予測の課題について紹介する。
一連の動作ラベルと短い動作履歴から、複数の可算な将来の動作を予測することを目的としている。
論文 参考訳(メタデータ) (2022-05-31T08:38:07Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Diverse and Admissible Trajectory Forecasting through Multimodal Context
Understanding [46.52703817997932]
自律走行におけるマルチエージェント軌道予測には、周囲の車両や歩行者の挙動を正確に予測するエージェントが必要である。
マルチモーダル世界から複数の入力信号を合成するモデルを提案する。
従来の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-06T13:59:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。