論文の概要: DA-BEV: Unsupervised Domain Adaptation for Bird's Eye View Perception
- arxiv url: http://arxiv.org/abs/2401.08687v1
- Date: Sat, 13 Jan 2024 04:21:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 18:42:05.351618
- Title: DA-BEV: Unsupervised Domain Adaptation for Bird's Eye View Perception
- Title(参考訳): DA-BEV:バードアイビュー知覚のための教師なしドメイン適応
- Authors: Kai Jiang, Jiaxing Huang, Weiying Xie, Yunsong Li, Ling Shao, Shijian
Lu
- Abstract要約: カメラのみのBird's Eye View (BEV)は3次元空間における環境認識に大きな可能性を示した。
非教師なし領域適応型BEVは、様々な未ラベル対象データから効果的に学習するが、まだ未探索である。
DA-BEVは、画像ビュー機能とBEV機能の相補性を利用して、ドメイン適応型BEV課題に対処する、最初のドメイン適応型カメラのみのBEVフレームワークである。
- 参考スコア(独自算出の注目度): 111.13119809216313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camera-only Bird's Eye View (BEV) has demonstrated great potential in
environment perception in a 3D space. However, most existing studies were
conducted under a supervised setup which cannot scale well while handling
various new data. Unsupervised domain adaptive BEV, which effective learning
from various unlabelled target data, is far under-explored. In this work, we
design DA-BEV, the first domain adaptive camera-only BEV framework that
addresses domain adaptive BEV challenges by exploiting the complementary nature
of image-view features and BEV features. DA-BEV introduces the idea of query
into the domain adaptation framework to derive useful information from
image-view and BEV features. It consists of two query-based designs, namely,
query-based adversarial learning (QAL) and query-based self-training (QST),
which exploits image-view features or BEV features to regularize the adaptation
of the other. Extensive experiments show that DA-BEV achieves superior domain
adaptive BEV perception performance consistently across multiple datasets and
tasks such as 3D object detection and 3D scene segmentation.
- Abstract(参考訳): カメラのみのBird's Eye View (BEV)は3次元空間における環境認識に大きな可能性を示した。
しかし、既存の研究のほとんどは、様々な新しいデータを扱う際にうまくスケールできない教師付きセットアップの下で行われた。
非教師なし領域適応型BEVは、様々な未ラベル対象データから効果的に学習するが、まだ未探索である。
本研究では、画像ビュー機能とBEV機能の相補的な性質を活用することで、ドメイン適応型BEV課題に対処する、最初のドメイン適応型カメラ専用BEVフレームワークであるDA-BEVを設計する。
DA-BEVは、画像ビューとBEVの機能から有用な情報を引き出すために、ドメイン適応フレームワークにクエリというアイデアを導入する。
これは、クエリベースの逆学習(qal)とクエリベースの自己学習(qst)という2つのクエリベースの設計から成り、画像ビュー機能やbev機能を利用して、互いの適応を規則化する。
DA-BEVは、複数のデータセットや3Dオブジェクト検出や3Dシーンセグメンテーションといったタスクにおいて、優れたドメイン適応型BEV知覚性能を実現する。
関連論文リスト
- BEVPose: Unveiling Scene Semantics through Pose-Guided Multi-Modal BEV Alignment [8.098296280937518]
本稿では,カメラとライダーデータからBEV表現を統合するフレームワークであるBEVPoseについて,センサポーズを誘導監視信号として用いた。
ポーズ情報を活用することで,環境の幾何学的側面と意味的側面の両方を捉えた潜在的BEV埋め込みの学習を容易にし,マルチモーダルな感覚入力を調整・融合する。
論文 参考訳(メタデータ) (2024-10-28T12:40:27Z) - Instance-aware Multi-Camera 3D Object Detection with Structural Priors
Mining and Self-Boosting Learning [93.71280187657831]
カメラによる鳥眼視(BEV)知覚パラダイムは、自律運転分野において大きな進歩を遂げている。
画像平面のインスタンス認識をBEV検出器内の深度推定プロセスに統合するIA-BEVを提案する。
論文 参考訳(メタデータ) (2023-12-13T09:24:42Z) - Towards Generalizable Multi-Camera 3D Object Detection via Perspective
Debiasing [28.874014617259935]
マルチカメラ3Dオブジェクト検出(MC3D-Det)は,鳥眼ビュー(BEV)の出現によって注目されている。
本研究では,3次元検出と2次元カメラ平面との整合性を両立させ,一貫した高精度な検出を実現する手法を提案する。
論文 参考訳(メタデータ) (2023-10-17T15:31:28Z) - SA-BEV: Generating Semantic-Aware Bird's-Eye-View Feature for Multi-view
3D Object Detection [46.92706423094971]
画像特徴のセマンティックセグメンテーションに応じて背景情報をフィルタリングするセマンティック・アウェア・BEVプール(SA-BEVPool)を提案する。
また、セマンティック・アウェアのBEV機能と密接にマッチする効果的なデータ拡張戦略であるBEV-Pasteを提案する。
nuScenesの実験では、SA-BEVが最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2023-07-21T10:28:19Z) - BEV-IO: Enhancing Bird's-Eye-View 3D Detection with Instance Occupancy [58.92659367605442]
我々は,BEV表現をインスタンス占有情報で拡張する新しい3次元検出パラダイムであるBEV-IOを提案する。
BEV-IOは、パラメータや計算オーバーヘッドの無視できる増加しか加えず、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-26T11:16:12Z) - Leveraging BEV Representation for 360-degree Visual Place Recognition [14.497501941931759]
本稿では,360度視覚位置認識(VPR)におけるBird's Eye View表現の利点について検討する。
本稿では,特徴抽出,特徴集約,視覚-LiDAR融合におけるBEV表現を利用した新しいネットワークアーキテクチャを提案する。
提案手法は,2つのデータセットのアブレーションおよび比較研究において評価される。
論文 参考訳(メタデータ) (2023-05-23T08:29:42Z) - Delving into the Devils of Bird's-eye-view Perception: A Review,
Evaluation and Recipe [115.31507979199564]
鳥眼視(BEV)における知覚タスクの強力な表現の学習は、産業と学界の両方から注目されつつある。
センサーの構成が複雑化するにつれて、異なるセンサーからの複数のソース情報の統合と、統一されたビューにおける特徴の表現が重要になる。
BEV知覚の中核的な問題は、(a)視点からBEVへの視点変換を通して失われた3D情報を再構成する方法、(b)BEVグリッドにおける基底真理アノテーションの取得方法、(d)センサー構成が異なるシナリオでアルゴリズムを適応・一般化する方法にある。
論文 参考訳(メタデータ) (2022-09-12T15:29:13Z) - PersDet: Monocular 3D Detection in Perspective Bird's-Eye-View [26.264139933212892]
Bird's-Eye-View (BEV)は、自律走行とロボット工学のための他の3D検出器よりも優れている。
画像特徴をBEVに変換するには、特別なオペレーターが特徴サンプリングを行う必要がある。
特徴サンプリングを必要としない新しいBEV表現であるBEVの視点で物体を検出することを提案する。
論文 参考訳(メタデータ) (2022-08-19T15:19:20Z) - M^2BEV: Multi-Camera Joint 3D Detection and Segmentation with Unified
Birds-Eye View Representation [145.6041893646006]
M$2$BEVは3Dオブジェクトの検出とマップのセグメンテーションを共同で行う統合フレームワークである。
M$2$BEVは、両方のタスクを統一モデルで推論し、効率を向上する。
論文 参考訳(メタデータ) (2022-04-11T13:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。