Fugu-MT 論文翻訳(概要): U-BEV: Height-aware Bird's-Eye-View Segmentation and Neural Map-based Relocalization

論文の概要: U-BEV: Height-aware Bird's-Eye-View Segmentation and Neural Map-based Relocalization

arxiv url: http://arxiv.org/abs/2310.13766v1
Date: Fri, 20 Oct 2023 18:57:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-25 05:26:44.138840
Title: U-BEV: Height-aware Bird's-Eye-View Segmentation and Neural Map-based Relocalization
Title（参考訳）: u-bev:ハイトアウェアバードズ・アイビューセグメンテーションとニューラルマップに基づく再局在化
Authors: Andrea Boscolo Camiletto, Alfredo Bochicchio, Alexander Liniger, Dengxin Dai, Abel Gawel
Abstract要約: GPS受信が不十分な場合やセンサベースのローカライゼーションが失敗する場合、インテリジェントな車両には再ローカライゼーションが不可欠である。 Bird's-Eye-View (BEV)セグメンテーションの最近の進歩は、局所的な景観の正確な推定を可能にする。本稿では,U-NetにインスパイアされたアーキテクチャであるU-BEVについて述べる。
参考スコア（独自算出の注目度）: 86.63465798307728
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Efficient relocalization is essential for intelligent vehicles when GPS reception is insufficient or sensor-based localization fails. Recent advances in Bird's-Eye-View (BEV) segmentation allow for accurate estimation of local scene appearance and in turn, can benefit the relocalization of the vehicle. However, one downside of BEV methods is the heavy computation required to leverage the geometric constraints. This paper presents U-BEV, a U-Net inspired architecture that extends the current state-of-the-art by allowing the BEV to reason about the scene on multiple height layers before flattening the BEV features. We show that this extension boosts the performance of the U-BEV by up to 4.11 IoU. Additionally, we combine the encoded neural BEV with a differentiable template matcher to perform relocalization on neural SD-map data. The model is fully end-to-end trainable and outperforms transformer-based BEV methods of similar computational complexity by 1.7 to 2.8 mIoU and BEV-based relocalization by over 26% Recall Accuracy on the nuScenes dataset.
Abstract（参考訳）: GPS受信が不十分な場合やセンサによるローカライゼーションが失敗する場合、インテリジェントな車両には効率的な再ローカライゼーションが不可欠である。近年のBird's-Eye-View (BEV)セグメンテーションの進歩により、局所的な景観の正確な推定が可能となり、車両の再位置化の恩恵を受けることができる。しかし、BEV手法の欠点の1つは、幾何学的制約を利用するのに必要な重い計算である。本稿では,u-netにインスパイアされたu-bevについて述べる。このu-bevは,bevの特徴をフラット化する前に,bevが複数の高さ層でシーンを判断できるようにすることにより,現在の最先端の技術を拡張したものである。この拡張により、U-BEVの性能は最大4.11IoU向上する。さらに、エンコードされたneural bevと微分可能なテンプレートマッチングを組み合わせることで、neural sd-mapデータ上で再ローカライズを行う。モデルは完全にエンドツーエンドのトレーニングが可能で、同様の計算複雑性を持つトランスフォーマーベースのBEV手法を1.7から2.8mIoUで、BEVベースの再ローカライゼーションを26%以上向上させる。

関連論文リスト

DenseBEV: Transforming BEV Grid Cells into 3D Objects [10.619058888618051]
Bird's-Eye-View (BEV)ベースのトランスフォーマーは、マルチカメラ3Dオブジェクト検出にますます利用されている。最近の進歩は、これらのランダムなクエリを補助的なネットワークからの検出で補完または置き換えている。本稿では,BEV機能セルを直接アンカーとして使用することで,より直感的で効率的なアプローチを提案する。
論文参考訳（メタデータ） (2025-12-18T17:59:22Z)
BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model [8.720833232645155]
Bird's-Eye-View (BEV) 画像は、自動運転において最も広く採用されているデータ表現の1つである。ポーズの条件生成としてLiDAR局所化を定式化する新しいフレームワークであるBEVDiffLocを提案する。
論文参考訳（メタデータ） (2025-03-14T13:17:43Z)
VQ-Map: Bird's-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector Quantization [108.68014173017583]
Bird's-eye-view (BEV) マップのレイアウト推定には、エゴ車の周囲の環境要素のセマンティクスを正確に完全に理解する必要がある。本稿では,Vector Quantized-Variational AutoEncoder (VQ-VAE) に似た生成モデルを用いて,トークン化された離散空間における高レベルのBEVセマンティクスの事前知識を取得することを提案する。得られたBEVトークンには,異なるBEV要素のセマンティクスを包含したコードブックが組み込まれているため,スパースバックボーン画像特徴と得られたBEVトークンとを直接一致させることができる。
論文参考訳（メタデータ） (2024-11-03T16:09:47Z)
BLOS-BEV: Navigation Map Enhanced Lane Segmentation Network, Beyond Line of Sight [30.45553559416835]
我々は,視線を超越した正確な知覚のためにSDマップを組み込んだ新しいBEVセグメンテーションモデルBLOS-BEVを提案する。我々のアプローチは一般的なBEVアーキテクチャに適用でき、SDマップから得られる情報を組み込むことで優れた結果を得ることができる。
論文参考訳（メタデータ） (2024-07-11T14:15:48Z)
Window-to-Window BEV Representation Learning for Limited FoV Cross-View Geo-localization [17.388776062997813]
W2W-BEVと呼ばれる新しいWindow-to-Window BEV表現学習手法を提案する。 W2W-BEVは、未知の配向と限られたFoVの条件下で、従来の最先端手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2024-07-09T13:48:28Z)
Improving Bird's Eye View Semantic Segmentation by Task Decomposition [42.57351039508863]
元のBEVセグメンテーションタスクを,BEVマップ再構成とRGB-BEV機能アライメントという2つの段階に分割する。我々のアプローチは、知覚と生成を異なるステップに組み合わせることの複雑さを単純化し、複雑で挑戦的なシーンを効果的に扱うためのモデルを構築します。
論文参考訳（メタデータ） (2024-04-02T13:19:45Z)
FB-BEV: BEV Representation from Forward-Backward View Transformations [131.11787050205697]
本稿では,Bird-Eye-View (BEV) 表現のためのビュートランスフォーメーションモジュール (VTM) を提案する。我々は提案したモジュールをFB-BEVでインスタンス化し、nuScenesテストセット上で62.4%のNDSの最先端結果を達成する。
論文参考訳（メタデータ） (2023-08-04T10:26:55Z)
BEV-IO: Enhancing Bird's-Eye-View 3D Detection with Instance Occupancy [58.92659367605442]
我々は,BEV表現をインスタンス占有情報で拡張する新しい3次元検出パラダイムであるBEV-IOを提案する。 BEV-IOは、パラメータや計算オーバーヘッドの無視できる増加しか加えず、最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2023-05-26T11:16:12Z)
MetaBEV: Solving Sensor Failures for BEV Detection and Map Segmentation [104.12419434114365]
現実世界のアプリケーションでは、センサの破損や故障がパフォーマンスの低下につながります。極端に現実世界の環境に対処するための,MetaBEVと呼ばれる堅牢なフレームワークを提案する。 MetaBEVは、完全なモダリティと腐敗したモダリティの両方に大きなマージンで、先行技術よりも優れています。
論文参考訳（メタデータ） (2023-04-19T16:37:17Z)
GitNet: Geometric Prior-based Transformation for Birds-Eye-View Segmentation [105.19949897812494]
Birds-eye-view (BEV) セマンティックセマンティックセグメンテーションは自動運転に不可欠である。本稿では,GitNetという新しい2段階のGeometry Preside-based Transformationフレームワークを提案する。
論文参考訳（メタデータ） (2022-04-16T06:46:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。