論文の概要: DeMo: Decoupling Motion Forecasting into Directional Intentions and Dynamic States
- arxiv url: http://arxiv.org/abs/2410.05982v1
- Date: Tue, 8 Oct 2024 12:27:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-01 11:50:19.117413
- Title: DeMo: Decoupling Motion Forecasting into Directional Intentions and Dynamic States
- Title(参考訳): DeMo: 動き予測を方向意図と動的状態に分離する
- Authors: Bozhou Zhang, Nan Song, Li Zhang,
- Abstract要約: マルチモーダルなトラジェクトリクエリを2つのタイプに分離するフレームワークであるDeMoを紹介する。
この形式を利用することで、軌道の多モード性と動的進化特性を別々に最適化する。
さらに,グローバルな情報集約と状態シーケンスモデリングのためのアテンションとマンバの併用手法についても紹介する。
- 参考スコア(独自算出の注目度): 6.856351850183536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate motion forecasting for traffic agents is crucial for ensuring the safety and efficiency of autonomous driving systems in dynamically changing environments. Mainstream methods adopt a one-query-one-trajectory paradigm, where each query corresponds to a unique trajectory for predicting multi-modal trajectories. While straightforward and effective, the absence of detailed representation of future trajectories may yield suboptimal outcomes, given that the agent states dynamically evolve over time. To address this problem, we introduce DeMo, a framework that decouples multi-modal trajectory queries into two types: mode queries capturing distinct directional intentions and state queries tracking the agent's dynamic states over time. By leveraging this format, we separately optimize the multi-modality and dynamic evolutionary properties of trajectories. Subsequently, the mode and state queries are integrated to obtain a comprehensive and detailed representation of the trajectories. To achieve these operations, we additionally introduce combined Attention and Mamba techniques for global information aggregation and state sequence modeling, leveraging their respective strengths. Extensive experiments on both the Argoverse 2 and nuScenes benchmarks demonstrate that our DeMo achieves state-of-the-art performance in motion forecasting.
- Abstract(参考訳): 交通機関の正確な動き予測は、動的に変化する環境における自律運転システムの安全性と効率を確保するために不可欠である。
メインストリームの手法は1-クエリ・ワン・トラジェクトリ・パラダイムを採用しており、各クエリはマルチモーダル・トラジェクトリを予測するためのユニークなトラジェクトリに対応する。
単純かつ効果的であるが、将来の軌道の詳細な表現がないことは、エージェント状態が時間とともに動的に進化することを考えると、最適以下の結果をもたらす可能性がある。
この問題に対処するため,マルチモーダルなトラジェクトリクエリを2つのタイプに分離するフレームワークであるDeMoを紹介した。
この形式を利用することで、軌道の多モード性と動的進化特性を別々に最適化する。
その後、モードと状態クエリを統合して、トラジェクトリの包括的かつ詳細な表現を得る。
これらの操作を実現するために,グローバルな情報集約と状態シーケンスモデリングのためのアテンションとマンバを組み合わせた手法を導入し,それぞれの強みを活用している。
Argoverse 2 と nuScenes のベンチマークによる大規模な実験により,DeMo が動作予測における最先端性能を達成していることが示された。
関連論文リスト
- Motion Forecasting in Continuous Driving [41.6423398623095]
自動運転では、自動運転車が動くと、動きの予測が繰り返し繰り返される。
既存の予測方法は、特定の範囲内で各走行シーンを独立に処理する。
本稿では,連続運転のための新しい動き予測フレームワークであるRealMotionを提案する。
論文 参考訳(メタデータ) (2024-10-08T13:04:57Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - DESTINE: Dynamic Goal Queries with Temporal Transductive Alignment for
Trajectory Prediction [8.25651323214656]
時間的変換型alIgNmEnt(DESTINE)法を用いた動的ゴールquErieSを提案する。
提案手法は,各種メトリクスの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-11T12:41:32Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-06-05T04:24:11Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - Event-Aware Multimodal Mobility Nowcasting [11.540605108140538]
イベント認識型時間ネットワークEAST-Netは、ソーシャルデータセットの多種多様な実世界のデータセットで評価される。
その結果、最先端のベースラインと比較して、我々のアプローチの優位性を検証した。
論文 参考訳(メタデータ) (2021-12-14T12:35:20Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。