論文の概要: Social Occlusion Inference with Vectorized Representation for Autonomous
Driving
- arxiv url: http://arxiv.org/abs/2303.10385v1
- Date: Sat, 18 Mar 2023 10:44:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 19:47:16.205499
- Title: Social Occlusion Inference with Vectorized Representation for Autonomous
Driving
- Title(参考訳): 自律運転のためのベクトル表現を用いた社会咬合推定
- Authors: Bochao Huang and Pin
- Abstract要約: 本稿では,エージェント・トラジェクトリとシーン・コンテキストから,エゴカーの視点を表す占有グリッド・マップ (OGM) へのマッピングを学習する,新しいソーシャル・オクルージョン・推論手法を提案する。
ベクトル化表現の性能を検証するため,完全トランスフォーマーエンコーダデコーダアーキテクチャに基づくベースラインを設計する。
我々は,現状の成果よりも優れるInterActionデータセットにおいて,符号なしの交差点に対するアプローチを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles must be capable of handling the occlusion of the
environment to ensure safe and efficient driving. In urban environment,
occlusion often arises due to other vehicles obscuring the perception of the
ego vehicle. Since the occlusion condition can impact the trajectories of
vehicles, the behavior of other vehicles is helpful in making inferences about
the occlusion as a remedy for perceptual deficiencies. This paper introduces a
novel social occlusion inference approach that learns a mapping from agent
trajectories and scene context to an occupancy grid map (OGM) representing the
view of ego vehicle. Specially, vectorized features are encoded through the
polyline encoder to aggregate features of vectors into features of polylines. A
transformer module is then utilized to model the high-order interactions of
polylines. Importantly, occlusion queries are proposed to fuse polyline
features and generate the OGM without the input of visual modality. To verify
the performance of vectorized representation, we design a baseline based on a
fully transformer encoder-decoder architecture mapping the OGM with occlusion
and historical trajectories information to the ground truth OGM. We evaluate
our approach on an unsignalized intersection in the INTERACTION dataset, which
outperforms the state-of-the-art results.
- Abstract(参考訳): 自動運転車は、安全かつ効率的な運転を確保するために、環境の閉塞を処理できる必要がある。
都市環境においては、エゴ車両の知覚を損なう他の車両による閉塞が発生することが多い。
閉塞状態は車両の軌道に影響を及ぼす可能性があるため、他の車両の挙動は、閉塞を知覚障害の治療法として推測するのに役立つ。
本稿では,エージェントの軌跡とシーンの文脈からエゴ車両の視点を表す占有グリッドマップ(occupancy grid map,ogm)へのマッピングを学習する新しい社会咬合推定手法を提案する。
特に、ベクトル化された特徴はポリラインエンコーダを介して符号化され、ベクトルの特徴をポリラインの特徴に集約する。
次にトランスフォーマーモジュールを使用してポリラインの高次相互作用をモデル化する。
重要なことは、ポリリンの特徴を融合させ、視覚的モダリティを入力せずにOGMを生成するために、オクルージョンクエリを提案することである。
ベクトル化表現の性能を検証するために, 完全トランスフォーマーエンコーダ-デコーダアーキテクチャに基づくベースラインの設計を行い, ogmをオクルージョンにマッピングし, 歴史的軌跡情報をグランド・トゥルートogmにマッピングする。
我々は,現状の成果よりも優れるInterActionデータセットにおける無署名の交差点に対するアプローチを評価する。
関連論文リスト
- GITSR: Graph Interaction Transformer-based Scene Representation for Multi Vehicle Collaborative Decision-making [9.910230703889956]
本研究では,交通状態の空間的相互作用の効率的な表現とモデル化に焦点を当てた。
本研究では,グラフインタラクショントランスフォーマに基づくシーン表現のための効果的なフレームワークであるGITSRを提案する。
論文 参考訳(メタデータ) (2024-11-03T15:27:26Z) - SocialFormer: Social Interaction Modeling with Edge-enhanced Heterogeneous Graph Transformers for Trajectory Prediction [3.733790302392792]
SocialFormerはエージェント間相互作用を意識した軌道予測手法である。
本稿では,エージェント動作の時間的社会的挙動をモデル化するために,ゲートリカレント単位(GRU)に基づくテンポラルエンコーダを提案する。
一般的なnuScenesベンチマークの軌道予測タスクとしてSocialFormerを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-05-06T19:47:23Z) - GraphAD: Interaction Scene Graph for End-to-end Autonomous Driving [16.245949174447574]
我々は,エゴ車両,道路エージェント,地図要素間の相互作用をモデル化するための統合手法として,インタラクションシーングラフ(ISG)を提案する。
提案手法をnuScenesデータセット上で評価した。
論文 参考訳(メタデータ) (2024-03-28T02:22:28Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - NMR: Neural Manifold Representation for Autonomous Driving [2.2596039727344452]
本研究では,有限地平線上の多様体上の意味論を推論し,経路点を予測する自律運転の表現を提案する。
本研究では, 周辺単分子画像と部分エゴ車状態の潜時高次元埋め込みに適用した反復的注意機構を用いてこれを行う。
本研究では,BEV占有格子のエッジ適応被覆損失に基づくサンプリングアルゴリズムを提案し,表面多様体を生成する。
論文 参考訳(メタデータ) (2022-05-11T14:58:08Z) - HDGT: Heterogeneous Driving Graph Transformer for Multi-Agent Trajectory
Prediction via Scene Encoding [76.9165845362574]
運転シーンをノードやエッジの異なる異種グラフとしてモデル化するバックボーンを提案する。
空間的関係符号化では、ノードの座標とエッジの座標は局所ノード中心座標系に含まれる。
実験結果から,HDGTは軌道予測のタスクに対して最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2022-04-30T07:08:30Z) - Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction [53.473846742702854]
本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
論文 参考訳(メタデータ) (2021-08-12T15:53:37Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized
Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。
ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。
我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文 参考訳(メタデータ) (2020-05-08T19:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。