論文の概要: HDGT: Heterogeneous Driving Graph Transformer for Multi-Agent Trajectory
Prediction via Scene Encoding
- arxiv url: http://arxiv.org/abs/2205.09753v1
- Date: Sat, 30 Apr 2022 07:08:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-29 21:22:58.048376
- Title: HDGT: Heterogeneous Driving Graph Transformer for Multi-Agent Trajectory
Prediction via Scene Encoding
- Title(参考訳): HDGT:シーンエンコーディングによるマルチエージェント軌道予測のための異種駆動グラフ変換器
- Authors: Xiaosong Jia, Penghao Wu, Li Chen, Hongyang Li, Yu Liu, Junchi Yan
- Abstract要約: 不均一運転グラフ変換器(HDGT)は、運転シーンを異なる種類のノードとエッジを持つ異種グラフとしてモデル化する。
グラフ構築では、各ノードはエージェントまたはロード要素を表し、各エッジはペデストリアン・ト・クロスウォーク、レーン・ト・レフト・レーンのようなセマンティクス関係を表す。
グラフニューラルネットワーク(GNN)のアグリゲーションモジュールでは、不均一な入力に適合する階層的な方法でトランスフォーマー構造を採用する。
- 参考スコア(独自算出の注目度): 76.9165845362574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One essential task for autonomous driving is to encode the information of a
driving scene into vector representations so that the downstream task such as
trajectory prediction could perform well. The driving scene is complicated, and
there exists heterogeneity within elements, where they own diverse types of
information i.e., agent dynamics, map routing, road lines, etc. Meanwhile,
there also exist relativity across elements - meaning they have spatial
relations with each other; such relations should be canonically represented
regarding the relative measurements since the absolute value of the coordinate
is meaningless. Taking these two observations into consideration, we propose a
novel backbone, namely Heterogeneous Driving Graph Transformer (HDGT), which
models the driving scene as a heterogeneous graph with different types of nodes
and edges. For graph construction, each node represents either an agent or a
road element and each edge represents their semantics relations such as
Pedestrian-To-Crosswalk, Lane-To-Left-Lane. As for spatial relation encoding,
instead of setting a fixed global reference, the coordinate information of the
node as well as its in-edges is transformed to the local node-centric
coordinate system. For the aggregation module in the graph neural network
(GNN), we adopt the transformer structure in a hierarchical way to fit the
heterogeneous nature of inputs. Experimental results show that the proposed
method achieves new state-of-the-art on INTERACTION Prediction Challenge and
Waymo Open Motion Challenge, in which we rank 1st and 2nd respectively
regarding the minADE/minFDE metric.
- Abstract(参考訳): 自動運転の重要なタスクの一つは、運転シーンの情報をベクトル表現にエンコードし、軌道予測のような下流タスクがうまく機能するようにすることだ。
運転シーンは複雑で、要素の中に異質性があり、エージェントダイナミクス、マップルーティング、ロードラインなど様々な種類の情報を所有している。
一方、要素間の相対性理論(つまり互いに空間的関係を持つ)も存在し、座標の絶対値が無意味であるため、相対的な測定について標準的に表現する必要がある。
これら2つの観測を考慮に入れ,異なる種類のノードとエッジを持つ異種グラフとして駆動シーンをモデル化した,新しいバックボーンであるヘテロジニアス駆動グラフ変換器(HDGT)を提案する。
グラフ構築では、各ノードはエージェントまたはロード要素を表し、各エッジは歩行者から横断歩道、車線から左車線といったセマンティクス関係を表す。
空間的関係符号化では、固定されたグローバル参照を設定する代わりに、ノードの座標情報とその内縁を局所ノード中心座標系に変換する。
グラフニューラルネットワーク(GNN)のアグリゲーションモジュールでは、入力の不均一性に適合する階層的な方法でトランスフォーマー構造を採用する。
実験の結果,提案手法は相互作用予測チャレンジとwaymoオープンモーションチャレンジにおいて,ミネード/ミンフデメトリックについてそれぞれ第1位と第2位にランク付けした。
関連論文リスト
- Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Graph Transformer GANs for Graph-Constrained House Generation [223.739067413952]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
GTGANは、グラフ制約のある住宅生成タスクにおいて、エンドツーエンドで効率的なグラフノード関係を学習する。
論文 参考訳(メタデータ) (2023-03-14T20:35:45Z) - SCENE: Reasoning about Traffic Scenes using Heterogeneous Graph Neural
Networks [12.038268908198287]
SCENEは異種グラフに様々なトラフィックシーンをエンコードする手法である。
タスク固有のデコーダを適用することで、シーンの望ましい属性を予測することができる。
論文 参考訳(メタデータ) (2023-01-09T17:05:28Z) - Trajectory Prediction with Graph-based Dual-scale Context Fusion [43.51107329748957]
本稿では,Dual Scale Predictorというグラフベースの軌道予測ネットワークを提案する。
静的および動的駆動コンテキストを階層的にエンコードする。
提案したデュアルスケールコンテキスト融合ネットワークにより、DSPは正確で人間らしいマルチモーダル軌道を生成することができる。
論文 参考訳(メタデータ) (2021-11-02T13:42:16Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z) - Graph Optimal Transport for Cross-Domain Alignment [121.80313648519203]
クロスドメインアライメントはコンピュータビジョンと自然言語処理の基本である。
我々は、最近の最適輸送(OT)の進歩から発芽する原則的なフレームワークであるグラフ最適輸送(GOT)を提案する。
実験は、幅広いタスクにわたるベースライン上でのGOTの一貫性のある性能を示す。
論文 参考訳(メタデータ) (2020-06-26T01:14:23Z) - VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized
Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。
ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。
我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文 参考訳(メタデータ) (2020-05-08T19:07:03Z) - CoMoGCN: Coherent Motion Aware Trajectory Prediction with Graph
Representation [12.580809204729583]
グループ制約のある混雑したシーンにおける軌道予測のための,コヒーレントな動き認識グラフ畳み込みネットワーク(CoMoGCN)を提案する。
提案手法は,複数のトラジェクトリ予測ベンチマーク上での最先端性能と,検討したすべてのベンチマークの中で最高の平均性能を実現する。
論文 参考訳(メタデータ) (2020-05-02T09:10:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。