論文の概要: Social Occlusion Inference with Vectorized Representation for Autonomous
Driving
- arxiv url: http://arxiv.org/abs/2303.10385v2
- Date: Wed, 16 Aug 2023 06:50:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 17:22:49.020076
- Title: Social Occlusion Inference with Vectorized Representation for Autonomous
Driving
- Title(参考訳): 自律運転のためのベクトル表現を用いた社会咬合推定
- Authors: Bochao Huang and Pin
- Abstract要約: 本稿では,エージェント・トラジェクトリとシーン・コンテキストから,エゴカーの視点を表す占有グリッド・マップ (OGM) へのマッピングを学習する,新しいソーシャル・オクルージョン・推論手法を提案する。
ベクトル化表現の性能を検証するため,完全トランスフォーマーエンコーダデコーダアーキテクチャに基づくベースラインを設計する。
我々は,現状の成果よりも優れるInterActionデータセットにおいて,符号なしの交差点に対するアプローチを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles must be capable of handling the occlusion of the
environment to ensure safe and efficient driving. In urban environment,
occlusion often arises due to other vehicles obscuring the perception of the
ego vehicle. Since the occlusion condition can impact the trajectories of
vehicles, the behavior of other vehicles is helpful in making inferences about
the occlusion as a remedy for perceptual deficiencies. This paper introduces a
novel social occlusion inference approach that learns a mapping from agent
trajectories and scene context to an occupancy grid map (OGM) representing the
view of ego vehicle. Specially, vectorized features are encoded through the
polyline encoder to aggregate features of vectors into features of polylines. A
transformer module is then utilized to model the high-order interactions of
polylines. Importantly, occlusion queries are proposed to fuse polyline
features and generate the OGM without the input of visual modality. To verify
the performance of vectorized representation, we design a baseline based on a
fully transformer encoder-decoder architecture mapping the OGM with occlusion
and historical trajectories information to the ground truth OGM. We evaluate
our approach on an unsignalized intersection in the INTERACTION dataset, which
outperforms the state-of-the-art results.
- Abstract(参考訳): 自動運転車は、安全かつ効率的な運転を確保するために、環境の閉塞を処理できる必要がある。
都市環境においては、エゴ車両の知覚を損なう他の車両による閉塞が発生することが多い。
閉塞状態は車両の軌道に影響を及ぼす可能性があるため、他の車両の挙動は、閉塞を知覚障害の治療法として推測するのに役立つ。
本稿では,エージェントの軌跡とシーンの文脈からエゴ車両の視点を表す占有グリッドマップ(occupancy grid map,ogm)へのマッピングを学習する新しい社会咬合推定手法を提案する。
特に、ベクトル化された特徴はポリラインエンコーダを介して符号化され、ベクトルの特徴をポリラインの特徴に集約する。
次にトランスフォーマーモジュールを使用してポリラインの高次相互作用をモデル化する。
重要なことは、ポリリンの特徴を融合させ、視覚的モダリティを入力せずにOGMを生成するために、オクルージョンクエリを提案することである。
ベクトル化表現の性能を検証するために, 完全トランスフォーマーエンコーダ-デコーダアーキテクチャに基づくベースラインの設計を行い, ogmをオクルージョンにマッピングし, 歴史的軌跡情報をグランド・トゥルートogmにマッピングする。
我々は,現状の成果よりも優れるInterActionデータセットにおける無署名の交差点に対するアプローチを評価する。
関連論文リスト
- Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - Graph-Based Interaction-Aware Multimodal 2D Vehicle Trajectory
Prediction using Diffusion Graph Convolutional Networks [17.989423104706397]
本研究では,グラフに基づく対話型多モード軌道予測フレームワークを提案する。
このフレームワーク内では、車両の動きは時間変化グラフのノードとして概念化され、交通相互作用は動的隣接行列によって表現される。
我々は、意図特異的な特徴融合を採用し、歴史的および将来の埋め込みの適応的な統合を可能にする。
論文 参考訳(メタデータ) (2023-09-05T06:28:13Z) - ConMAE: Contour Guided MAE for Unsupervised Vehicle Re-Identification [8.950873153831735]
本研究は、ConMAE(Unsupervised Vehicle Re-Identification)のためのContour Guided Masked Autoencoderを設計する。
Masked Autoencoder (MAE) は自己教師付き学習において優れた性能を発揮していることを考慮し、ConMAE (Contour Guided Masked Autoencoder for Unsupervised Vehicle Re-Identification) を設計した。
論文 参考訳(メタデータ) (2023-02-11T12:10:25Z) - NMR: Neural Manifold Representation for Autonomous Driving [2.2596039727344452]
本研究では,有限地平線上の多様体上の意味論を推論し,経路点を予測する自律運転の表現を提案する。
本研究では, 周辺単分子画像と部分エゴ車状態の潜時高次元埋め込みに適用した反復的注意機構を用いてこれを行う。
本研究では,BEV占有格子のエッジ適応被覆損失に基づくサンプリングアルゴリズムを提案し,表面多様体を生成する。
論文 参考訳(メタデータ) (2022-05-11T14:58:08Z) - HDGT: Heterogeneous Driving Graph Transformer for Multi-Agent Trajectory
Prediction via Scene Encoding [76.9165845362574]
運転シーンをノードやエッジの異なる異種グラフとしてモデル化するバックボーンを提案する。
空間的関係符号化では、ノードの座標とエッジの座標は局所ノード中心座標系に含まれる。
実験結果から,HDGTは軌道予測のタスクに対して最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2022-04-30T07:08:30Z) - Domain Knowledge Driven Pseudo Labels for Interpretable Goal-Conditioned
Interactive Trajectory Prediction [29.701029725302586]
目標条件付きフレームワークを用いた共同軌道予測問題について検討する。
本研究では,条件付き変分自動エンコーダ(CVAE)モデルを導入し,異なる相互作用モードを潜在空間に明示的にエンコードする。
KLの消滅を回避する新しい手法を提案し、擬似ラベルを用いた解釈可能な対話型潜在空間を誘導する。
論文 参考訳(メタデータ) (2022-03-28T21:41:21Z) - Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction [53.473846742702854]
本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
論文 参考訳(メタデータ) (2021-08-12T15:53:37Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized
Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。
ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。
我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文 参考訳(メタデータ) (2020-05-08T19:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。