論文の概要: NMR: Neural Manifold Representation for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2205.05551v1
- Date: Wed, 11 May 2022 14:58:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 20:57:33.721573
- Title: NMR: Neural Manifold Representation for Autonomous Driving
- Title(参考訳): NMR:自律運転のためのニューラルマニフォールド表現
- Authors: Unnikrishnan R. Nair, Sarthak Sharma, Midhun S. Menon, Srikanth
Vidapanakal
- Abstract要約: 本研究では,有限地平線上の多様体上の意味論を推論し,経路点を予測する自律運転の表現を提案する。
本研究では, 周辺単分子画像と部分エゴ車状態の潜時高次元埋め込みに適用した反復的注意機構を用いてこれを行う。
本研究では,BEV占有格子のエッジ適応被覆損失に基づくサンプリングアルゴリズムを提案し,表面多様体を生成する。
- 参考スコア(独自算出の注目度): 2.2596039727344452
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Autonomous driving requires efficient reasoning about the Spatio-temporal
nature of the semantics of the scene. Recent approaches have successfully
amalgamated the traditional modular architecture of an autonomous driving stack
comprising perception, prediction, and planning in an end-to-end trainable
system. Such a system calls for a shared latent space embedding with
interpretable intermediate trainable projected representation. One such
successfully deployed representation is the Bird's-Eye View(BEV) representation
of the scene in ego-frame. However, a fundamental assumption for an undistorted
BEV is the local coplanarity of the world around the ego-vehicle. This
assumption is highly restrictive, as roads, in general, do have gradients. The
resulting distortions make path planning inefficient and incorrect. To overcome
this limitation, we propose Neural Manifold Representation (NMR), a
representation for the task of autonomous driving that learns to infer
semantics and predict way-points on a manifold over a finite horizon, centered
on the ego-vehicle. We do this using an iterative attention mechanism applied
on a latent high dimensional embedding of surround monocular images and partial
ego-vehicle state. This representation helps generate motion and behavior plans
consistent with and cognizant of the surface geometry. We propose a sampling
algorithm based on edge-adaptive coverage loss of BEV occupancy grid and
associated guidance flow field to generate the surface manifold while incurring
minimal computational overhead. We aim to test the efficacy of our approach on
CARLA and SYNTHIA-SF.
- Abstract(参考訳): 自律運転は、シーンの意味論の時空間的性質についての効率的な推論を必要とする。
最近のアプローチは、エンドツーエンドのトレーニング可能なシステムにおいて、知覚、予測、計画を含む自動運転スタックの従来のモジュラーアーキテクチャを融合させることに成功した。
このようなシステムは、解釈可能な中間トレーサブルな射影表現を持つ共有潜在空間の埋め込みを要求する。
このようなデプロイに成功した表現のひとつが、Ego-frameにおけるシーンのBird's-Eye View(BEV)表現である。
しかしながら、非歪なBEVの基本的な仮定は、エゴ車周りの世界の局所的共計画性である。
この仮定は非常に制限的であり、道路は概して勾配を持っている。
結果として生じる歪みは、経路計画の非効率性と誤りをもたらす。
この制限を克服するために、我々は自律運転タスクの表現であるニューラルマニフォールド表現(NMR)を提案し、これは、エゴ車を中心にした有限地平線上の多様体上の意味論を推論し、道点を予測することを学習する。
周辺単眼像の潜伏高次元埋め込みと部分的エゴ・ベシクル状態に適用した反復的注意機構を用いてこれを行う。
この表現は、表面幾何学の認識と一致した動きと行動計画を生成するのに役立つ。
本稿では,BEV占有格子のエッジ適応被覆損失とそれに伴う誘導流場に基づくサンプリングアルゴリズムを提案し,計算オーバーヘッドを最小限に抑えながら表面多様体を生成する。
CARLAとSynTHIA-SFに対するアプローチの有効性を検証することを目的としている。
関連論文リスト
- DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - QuAD: Query-based Interpretable Neural Motion Planning for Autonomous Driving [33.609780917199394]
自動運転車は環境を理解して適切な行動を決定する必要がある。
従来のシステムは、シーン内のエージェントを見つけるためにオブジェクト検出に依存していた。
我々は、最初に占有する時間的自律性を知覚するカスケードモジュールから遠ざかる、統一的で解釈可能で効率的な自律フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-01T21:11:43Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - Social Occlusion Inference with Vectorized Representation for Autonomous
Driving [0.0]
本稿では,エージェント・トラジェクトリとシーン・コンテキストから,エゴカーの視点を表す占有グリッド・マップ (OGM) へのマッピングを学習する,新しいソーシャル・オクルージョン・推論手法を提案する。
ベクトル化表現の性能を検証するため,完全トランスフォーマーエンコーダデコーダアーキテクチャに基づくベースラインを設計する。
我々は,現状の成果よりも優れるInterActionデータセットにおいて,符号なしの交差点に対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-03-18T10:44:39Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - Exploring Contextual Representation and Multi-Modality for End-to-End
Autonomous Driving [58.879758550901364]
最近の知覚システムは、センサー融合による空間理解を高めるが、しばしば完全な環境コンテキストを欠いている。
我々は,3台のカメラを統合し,人間の視野をエミュレートするフレームワークを導入し,トップダウンのバードアイビューセマンティックデータと組み合わせて文脈表現を強化する。
提案手法は, オープンループ設定において0.67mの変位誤差を達成し, nuScenesデータセットでは6.9%の精度で現在の手法を上回っている。
論文 参考訳(メタデータ) (2022-10-13T05:56:20Z) - NEAT: Neural Attention Fields for End-to-End Autonomous Driving [59.60483620730437]
本稿では、模倣学習モデルの効率的な推論を可能にする新しい表現であるNEAT(NEural Attention Field)を提案する。
NEATは、Bird's Eye View (BEV) シーン座標の位置をウェイポイントとセマンティクスにマッピングする連続関数である。
有害な環境条件や挑戦的なシナリオを含む新たな評価環境では、NEATはいくつかの強いベースラインを上回り、特権のあるCARLA専門家と同等の運転スコアを達成している。
論文 参考訳(メタデータ) (2021-09-09T17:55:28Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。