論文の概要: GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting
- arxiv url: http://arxiv.org/abs/2211.02545v1
- Date: Fri, 4 Nov 2022 16:10:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 15:50:51.890981
- Title: GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting
- Title(参考訳): GoRela: ビューポイント不変モーション予測のためのGo相対性
- Authors: Alexander Cui, Sergio Casas, Kelvin Wong, Simon Suo, Raquel Urtasun
- Abstract要約: 精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
- 参考スコア(独自算出の注目度): 121.42898228997538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of motion forecasting is critical for self-driving vehicles (SDVs)
to be able to plan a safe maneuver. Towards this goal, modern approaches reason
about the map, the agents' past trajectories and their interactions in order to
produce accurate forecasts. The predominant approach has been to encode the map
and other agents in the reference frame of each target agent. However, this
approach is computationally expensive for multi-agent prediction as inference
needs to be run for each agent. To tackle the scaling challenge, the solution
thus far has been to encode all agents and the map in a shared coordinate frame
(e.g., the SDV frame). However, this is sample inefficient and vulnerable to
domain shift (e.g., when the SDV visits uncommon states). In contrast, in this
paper, we propose an efficient shared encoding for all agents and the map
without sacrificing accuracy or generalization. Towards this goal, we leverage
pair-wise relative positional encodings to represent geometric relationships
between the agents and the map elements in a heterogeneous spatial graph. This
parameterization allows us to be invariant to scene viewpoint, and save online
computation by re-using map embeddings computed offline. Our decoder is also
viewpoint agnostic, predicting agent goals on the lane graph to enable diverse
and context-aware multimodal prediction. We demonstrate the effectiveness of
our approach on the urban Argoverse 2 benchmark as well as a novel highway
dataset.
- Abstract(参考訳): 運動予測のタスクは、自動運転車(SDV)が安全な操作を計画できることに不可欠である。
この目標に向けて、現代のアプローチでは、正確な予測を生成するために、地図、エージェントの過去の軌道、それらの相互作用について推論する。
主なアプローチは、それぞれのターゲットエージェントの参照フレームにマップや他のエージェントをエンコードすることであった。
しかし、エージェント毎に推論を実行する必要があるため、マルチエージェント予測には計算コストがかかる。
スケーリングの課題に取り組むため、これまでのソリューションは、すべてのエージェントとマップを共有座標フレーム(例えばSDVフレーム)にエンコードすることであった。
しかし、これはサンプル非効率であり、ドメインシフトに弱い(例:SDVが珍しい状態を訪れたとき)。
そこで本研究では,すべてのエージェントとマップに対して,精度や一般化を犠牲にすることなく効率的な共有符号化を提案する。
この目的に向けて,ペアワイズ相対位置符号化を利用して,異種空間グラフにおけるエージェントとマップ要素の幾何学的関係を表現する。
このパラメータ化により、シーン視点に不変であり、オフラインで計算されたマップ埋め込みを再利用することでオンライン計算を節約できる。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
本研究では,都市argoverse 2ベンチマークおよび新しい高速道路データセットにおける提案手法の有効性を実証する。
関連論文リスト
- Towards Consistent and Explainable Motion Prediction using Heterogeneous Graph Attention [0.17476232824732776]
本稿では,予測軌道を実際の地図に投影する改良モジュールを提案する。
また,エージェントと環境のすべての関係を単一の統合グラフアテンションネットワークで処理する新しいシーンエンコーダを提案する。
論文 参考訳(メタデータ) (2024-05-16T14:31:15Z) - SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs [3.733790302392792]
自動運転におけるトレイ予測は、運転シーンのすべての関連状況の正確な表現に依存している。
本稿では,交通シーングラフの推論によるマルチモーダル軌道の予測手法であるSemanticFormerを提案する。
論文 参考訳(メタデータ) (2024-04-30T09:11:04Z) - ADAPT: Efficient Multi-Agent Trajectory Prediction with Adaptation [0.0]
ADAPTはダイナミックウェイトラーニングによってシーン内の全てのエージェントの軌道を共同で予測するための新しいアプローチである。
提案手法は, 単一エージェントと複数エージェントの設定において, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-26T13:41:51Z) - Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction [53.473846742702854]
本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
論文 参考訳(メタデータ) (2021-08-12T15:53:37Z) - LaneRCNN: Distributed Representations for Graph-Centric Motion
Forecasting [104.8466438967385]
LaneRCNNはグラフ中心のモーション予測モデルです。
アクターごとのローカルレーングラフ表現を学び、過去の動きとローカルマップのトポロジをエンコードします。
我々はレーングラフに基づいて出力軌跡をパラメータ化し,よりアメニブルな予測パラメータ化を行う。
論文 参考訳(メタデータ) (2021-01-17T11:54:49Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized
Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。
ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。
我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文 参考訳(メタデータ) (2020-05-08T19:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。