論文の概要: RoboBEV: Towards Robust Bird's Eye View Perception under Corruptions
- arxiv url: http://arxiv.org/abs/2304.06719v1
- Date: Thu, 13 Apr 2023 17:59:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-14 13:21:07.223756
- Title: RoboBEV: Towards Robust Bird's Eye View Perception under Corruptions
- Title(参考訳): RoboBEV:倒産後のロバストバードの視線認識に向けて
- Authors: Shaoyuan Xie, Lingdong Kong, Wenwei Zhang, Jiawei Ren, Liang Pan, Kai
Chen, Ziwei Liu
- Abstract要約: 我々は、Bright、Dark、Fog、Snow、Motion Blur、Color Quant、Camera Crash、Frame Lostを含む8つの異なる汚職を含む総合的なベンチマークスイートであるRoboBEVを紹介した。
これに基づいて、我々は幅広いBEVベースのモデルに対して広範囲な評価を行い、そのレジリエンスと信頼性を理解します。
我々の発見は、現実の展開において正確性と堅牢性を両立できる将来のBEVモデルを設計するための貴重な洞察を提供する。
- 参考スコア(独自算出の注目度): 34.111443808494506
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The recent advances in camera-based bird's eye view (BEV) representation
exhibit great potential for in-vehicle 3D perception. Despite the substantial
progress achieved on standard benchmarks, the robustness of BEV algorithms has
not been thoroughly examined, which is critical for safe operations. To bridge
this gap, we introduce RoboBEV, a comprehensive benchmark suite that
encompasses eight distinct corruptions, including Bright, Dark, Fog, Snow,
Motion Blur, Color Quant, Camera Crash, and Frame Lost. Based on it, we
undertake extensive evaluations across a wide range of BEV-based models to
understand their resilience and reliability. Our findings indicate a strong
correlation between absolute performance on in-distribution and
out-of-distribution datasets. Nonetheless, there are considerable variations in
relative performance across different approaches. Our experiments further
demonstrate that pre-training and depth-free BEV transformation has the
potential to enhance out-of-distribution robustness. Additionally, utilizing
long and rich temporal information largely helps with robustness. Our findings
provide valuable insights for designing future BEV models that can achieve both
accuracy and robustness in real-world deployments.
- Abstract(参考訳): 近年のカメラベースバードアイビュー(BEV)表示の進歩は、車載3D知覚に大きな可能性を示している。
標準ベンチマークでのかなりの進歩にもかかわらず、BEVアルゴリズムの堅牢性は十分には検討されていない。
このギャップを埋めるために、私たちは、Bright、Dark、Fog、Snow、Motion Blur、Color Quant、Camera Crash、Frame Lostを含む8つの異なる汚職を含む包括的なベンチマークスイートであるRoboBEVを紹介した。
それに基づいて,幅広いbevベースモデルに対する広範な評価を行い,レジリエンスと信頼性について検討した。
以上の結果から,分布内絶対性能と分布外データセットとの間には強い相関関係があることが示唆された。
それでも、異なるアプローチにまたがる相対的なパフォーマンスにはかなりのバリエーションがある。
さらに, 事前学習および深度自由なBEVトランスフォーメーションが, 分布外ロバスト性を高める可能性を実証した。
さらに、長く豊かな時間情報を活用することは、堅牢性に大きく寄与する。
我々の発見は、現実の展開において正確性と堅牢性を両立できる将来のBEVモデルを設計するための貴重な洞察を提供する。
関連論文リスト
- Robust Bird's Eye View Segmentation by Adapting DINOv2 [3.236198583140341]
低ランク適応(LoRA)を用いた視覚基礎モデルDINOv2をBEV推定に適用する。
我々の実験は、様々な汚職下でのBEV知覚の堅牢性を高めることを示した。
また,適応表現の有効性を,学習可能なパラメータの少ないこと,学習中の収束の高速化の観点から示す。
論文 参考訳(メタデータ) (2024-09-16T12:23:35Z) - Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.93813178692077]
本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。
検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。
また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文 参考訳(メタデータ) (2024-05-27T17:59:39Z) - CLIP-BEVFormer: Enhancing Multi-View Image-Based BEV Detector with Ground Truth Flow [20.550935390111686]
CLIP-BEVFormerは,多視点画像由来のBEVバックボーンを接地真実情報フローで拡張する新しい手法である。
我々は、挑戦的なnuScenesデータセットに関する広範な実験を行い、SOTAに対して顕著で一貫した改善を示す。
論文 参考訳(メタデータ) (2024-03-13T19:21:03Z) - DA-BEV: Unsupervised Domain Adaptation for Bird's Eye View Perception [104.87876441265593]
カメラのみのBird's Eye View (BEV)は3次元空間における環境認識に大きな可能性を示した。
非教師なし領域適応型BEVは、様々な未ラベル対象データから効果的に学習するが、まだ未探索である。
DA-BEVは、画像ビュー機能とBEV機能の相補性を利用して、ドメイン適応型BEV課題に対処する、最初のドメイン適応型カメラのみのBEVフレームワークである。
論文 参考訳(メタデータ) (2024-01-13T04:21:24Z) - Instance-aware Multi-Camera 3D Object Detection with Structural Priors
Mining and Self-Boosting Learning [93.71280187657831]
カメラによる鳥眼視(BEV)知覚パラダイムは、自律運転分野において大きな進歩を遂げている。
画像平面のインスタンス認識をBEV検出器内の深度推定プロセスに統合するIA-BEVを提案する。
論文 参考訳(メタデータ) (2023-12-13T09:24:42Z) - BroadBEV: Collaborative LiDAR-camera Fusion for Broad-sighted Bird's Eye
View Map Construction [31.664613321775516]
そこで本稿では,空間的同期手法を用いて,BroadBEV(BroadBEV)とBroadBEV(BroadBEV)の融合を提案する。
我々の戦略は、広視野認識のためのカメラBEV推定を強化し、同時に、全BEV空間におけるLiDARの空き度を向上することである。
論文 参考訳(メタデータ) (2023-09-20T07:55:57Z) - Robo3D: Towards Robust and Reliable 3D Perception against Corruptions [58.306694836881235]
我々は,3次元検出器とセグメンタのロバスト性を,アウト・オブ・ディストリビューションのシナリオで検証するための,最初の総合的なベンチマークであるRobo3Dを紹介する。
気象条件の悪化,外乱,センサの故障などに起因する8種類の汚職について検討した。
本稿では,モデルレジリエンスを高めるための簡易なフレキシブルなボキセル化戦略とともに,密度に敏感なトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T17:59:17Z) - Understanding the Robustness of 3D Object Detection with Bird's-Eye-View
Representations in Autonomous Driving [31.98600806479808]
Bird's-Eye-View (BEV)表現は、一般的なベンチマークでカメラ入力を備えた3D検出器の性能を大幅に改善した。
様々な代表モデルの自然的・敵対的ロバスト性を広範囲な環境下で評価する。
本稿では,時間的3次元空間に逆パッチを適用して,その整合性を保証する3次元一貫したパッチアタックを提案する。
論文 参考訳(メタデータ) (2023-03-30T11:16:58Z) - Delving into the Devils of Bird's-eye-view Perception: A Review,
Evaluation and Recipe [115.31507979199564]
鳥眼視(BEV)における知覚タスクの強力な表現の学習は、産業と学界の両方から注目されつつある。
センサーの構成が複雑化するにつれて、異なるセンサーからの複数のソース情報の統合と、統一されたビューにおける特徴の表現が重要になる。
BEV知覚の中核的な問題は、(a)視点からBEVへの視点変換を通して失われた3D情報を再構成する方法、(b)BEVグリッドにおける基底真理アノテーションの取得方法、(d)センサー構成が異なるシナリオでアルゴリズムを適応・一般化する方法にある。
論文 参考訳(メタデータ) (2022-09-12T15:29:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。