論文の概要: SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2404.19379v2
- Date: Mon, 27 May 2024 14:56:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 05:37:42.425116
- Title: SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs
- Title(参考訳): セマンティックフォーマー:知識グラフを用いた軌道予測のための全体的かつセマンティックな交通シーン表現
- Authors: Zhigang Sun, Zixu Wang, Lavdim Halilaj, Juergen Luettin,
- Abstract要約: 自動運転におけるトレイ予測は、運転シーンのすべての関連状況の正確な表現に依存している。
本稿では,交通シーングラフの推論によるマルチモーダル軌道の予測手法であるSemanticFormerを提案する。
- 参考スコア(独自算出の注目度): 3.733790302392792
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Trajectory prediction in autonomous driving relies on accurate representation of all relevant contexts of the driving scene, including traffic participants, road topology, traffic signs, as well as their semantic relations to each other. Despite increased attention to this issue, most approaches in trajectory prediction do not consider all of these factors sufficiently. We present SemanticFormer, an approach for predicting multimodal trajectories by reasoning over a semantic traffic scene graph using a hybrid approach. It utilizes high-level information in the form of meta-paths, i.e. trajectories on which an agent is allowed to drive from a knowledge graph which is then processed by a novel pipeline based on multiple attention mechanisms to predict accurate trajectories. SemanticFormer comprises a hierarchical heterogeneous graph encoder to capture spatio-temporal and relational information across agents as well as between agents and road elements. Further, it includes a predictor to fuse different encodings and decode trajectories with probabilities. Finally, a refinement module assesses permitted meta-paths of trajectories and speed profiles to obtain final predicted trajectories. Evaluation of the nuScenes benchmark demonstrates improved performance compared to several SOTA methods. In addition, we demonstrate that our knowledge graph can be easily added to two graph-based existing SOTA methods, namely VectorNet and Laformer, replacing their original homogeneous graphs. The evaluation results suggest that by adding our knowledge graph the performance of the original methods is enhanced by 5% and 4%, respectively.
- Abstract(参考訳): 自律運転における軌道予測は、交通参加者、道路トポロジ、交通標識、およびそれらの相互の意味的関係を含む、運転シーンのすべての関連状況の正確な表現に依存する。
この問題に注目が集まる一方で、軌道予測のほとんどのアプローチはこれらの要因を十分に考慮していない。
本稿では,セマンティックフォーマー(SemanticFormer)を提案する。セマンティックフォーマー(SemanticFormer)は,ハイブリッド手法を用いて,セマンティックトラフィックシーングラフを推論することで,マルチモーダルトラジェクトリを予測する手法である。
すなわち、エージェントが知識グラフから駆動することを許された軌跡を、複数の注意機構に基づいて新しいパイプラインで処理し、正確な軌跡を予測する。
SemanticFormerは階層的なヘテロジニアスグラフエンコーダで構成されており、エージェント間だけでなくエージェントとロード要素間の時空間およびリレーショナル情報をキャプチャする。
さらに、異なるエンコーディングを融合させ、確率で軌道を復号する予測器を含む。
最後に、改良モジュールは、許容されたトラジェクトリと速度プロファイルのメタパスを評価し、最終的な予測されたトラジェクトリを得る。
nuScenesベンチマークの評価は、いくつかのSOTA手法と比較して改善された性能を示す。
さらに、我々は知識グラフを、VectorNetとLaformerという2つのグラフベースの既存のSOTAメソッドに簡単に追加できることを実証した。
評価結果は,知識グラフを付加することにより,元の手法の性能を5%と4%向上させることを示唆している。
関連論文リスト
- Towards Consistent and Explainable Motion Prediction using Heterogeneous Graph Attention [0.17476232824732776]
本稿では,予測軌道を実際の地図に投影する改良モジュールを提案する。
また,エージェントと環境のすべての関係を単一の統合グラフアテンションネットワークで処理する新しいシーンエンコーダを提案する。
論文 参考訳(メタデータ) (2024-05-16T14:31:15Z) - nuScenes Knowledge Graph -- A comprehensive semantic representation of
traffic scenes for trajectory prediction [6.23221362105447]
交通シーンにおける軌道予測は、周囲の車両の挙動を正確に予測する。
車両の走行経路、道路トポロジー、車線分割器、交通規則など、文脈情報を考慮することが重要である。
本稿では,知識グラフを用いて交通シーン内の多様なエンティティとその意味的関係をモデル化する手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T10:40:34Z) - Heterogeneous Graph-based Trajectory Prediction using Local Map Context
and Social Interactions [47.091620047301305]
本稿では,3つの重要な情報源を活用することにより,欠点に対処するベクトルベース軌道予測手法を提案する。
まず,その関係の性質と重要な特徴を考慮に入れたセマンティックシーングラフを用いて,トラフィックエージェント間のインタラクションをモデル化する。
第2に,ローカルマップコンテキストをモデル化するために,エージェント中心の画像中心マップの特徴を抽出する。
論文 参考訳(メタデータ) (2023-11-30T13:46:05Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Trajectory Prediction with Graph-based Dual-scale Context Fusion [43.51107329748957]
本稿では,Dual Scale Predictorというグラフベースの軌道予測ネットワークを提案する。
静的および動的駆動コンテキストを階層的にエンコードする。
提案したデュアルスケールコンテキスト融合ネットワークにより、DSPは正確で人間らしいマルチモーダル軌道を生成することができる。
論文 参考訳(メタデータ) (2021-11-02T13:42:16Z) - Semantics-STGCNN: A Semantics-guided Spatial-Temporal Graph
Convolutional Network for Multi-class Trajectory Prediction [9.238700679836855]
グラフ畳み込みニューラルネットワークにクラス情報を導入し、個人の軌道をより正確に予測する。
AADE(Average2 Displacement Error)とaFDE(Average Final Deplacement Error)と呼ばれる新しいメトリクスを提案する。
既存のメトリクスや新しく提案されたメトリクスの最先端よりも、一貫して優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-08-10T15:02:50Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Spatio-Temporal Graph Dual-Attention Network for Multi-Agent Prediction
and Tracking [23.608125748229174]
異種エージェントを含む多エージェント軌道予測のための汎用生成ニューラルシステムを提案する。
提案システムは, 軌道予測のための3つのベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-02-18T02:25:35Z) - VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized
Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。
ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。
我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文 参考訳(メタデータ) (2020-05-08T19:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。