論文の概要: SGM3D: Stereo Guided Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2112.01914v1
- Date: Fri, 3 Dec 2021 13:57:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 15:50:41.043235
- Title: SGM3D: Stereo Guided Monocular 3D Object Detection
- Title(参考訳): SGM3D:ステレオガイド単眼物体検出
- Authors: Zheyuan Zhou and Liang Du and Xiaoqing Ye and Zhikang Zou and Xiao Tan
and Errui Ding and Li Zhang and Xiangyang Xue and Jianfeng Feng
- Abstract要約: SGM3Dと呼ばれるステレオ誘導単分子物体検出ネットワークを提案する。
ステレオ画像から抽出したロバストな3次元特徴を利用して、モノクル画像から得られた特徴を強化する。
本手法は,余分な計算コストを伴わずに性能を向上させるために,他の多くの単分子的手法に統合することができる。
- 参考スコア(独自算出の注目度): 62.11858392862551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D object detection is a critical yet challenging task for
autonomous driving, due to the lack of accurate depth information captured by
LiDAR sensors. In this paper, we propose a stereo-guided monocular 3D object
detection network, termed SGM3D, which leverages robust 3D features extracted
from stereo images to enhance the features learned from the monocular image. We
innovatively investigate a multi-granularity domain adaptation module (MG-DA)
to exploit the network's ability so as to generate stereo-mimic features only
based on the monocular cues. The coarse BEV feature-level, as well as the fine
anchor-level domain adaptation, are leveraged to guide the monocular branch. We
present an IoU matching-based alignment module (IoU-MA) for object-level domain
adaptation between the stereo and monocular predictions to alleviate the
mismatches in previous stages. We conduct extensive experiments on the most
challenging KITTI and Lyft datasets and achieve new state-of-the-art
performance. Furthermore, our method can be integrated into many other
monocular approaches to boost performance without introducing any extra
computational cost.
- Abstract(参考訳): lidarセンサーが捉えた正確な深度情報がないため、モノキュラーな3d物体検出は自動運転にとって非常に難しい課題である。
本稿では,ステレオ画像から抽出したロバストな3D特徴を活用し,モノクロ画像から学習した特徴を高めるステレオ誘導型モノクロ3Dオブジェクト検出ネットワークSGM3Dを提案する。
我々は,モノクラーキューのみに基づいてステレオミミックな特徴を生成するために,ネットワークの能力を利用する多粒度ドメイン適応モジュール(MG-DA)を革新的に検討する。
粗いBEV特徴レベルと細かなアンカーレベルドメイン適応を利用して、単分子分岐を誘導する。
ステレオとモノラル予測のオブジェクトレベルドメイン適応のためのIoUマッチングベースのアライメントモジュール(IoU-MA)を提案する。
私たちは、最も困難なKITTIとLyftデータセットに関する広範な実験を行い、新しい最先端のパフォーマンスを実現しています。
さらに,計算コストを増すことなく性能を向上させるために,他の多くの単眼的手法に統合することができる。
関連論文リスト
- Scalable Vision-Based 3D Object Detection and Monocular Depth Estimation
for Autonomous Driving [5.347428263669927]
この論文は、視覚に基づく3D知覚技術の進歩への多面的な貢献である。
第1節では、この論文はモノクロとステレオの両方のオブジェクト検出アルゴリズムに構造的拡張を導入している。
第2のセグメントは、データ駆動戦略と、3D視覚検出における実世界の応用に特化している。
論文 参考訳(メタデータ) (2024-03-04T13:42:54Z) - ODM3D: Alleviating Foreground Sparsity for Semi-Supervised Monocular 3D
Object Detection [15.204935788297226]
ODM3Dフレームワークは、トレーニング中にLiDARドメインの知識を単分子検出器に注入するために、様々なレベルでのクロスモーダルな知識蒸留を必要とする。
既存手法の準最適トレーニングの主要因として,前景の空間空間を同定することにより,LiDAR点に埋め込まれた正確な位置化情報を活用する。
KITTI検証とテストベンチマークの両方で1位にランクインし、教師付きまたは半教師付きである既存のモノクラー手法をはるかに上回っている。
論文 参考訳(メタデータ) (2023-10-28T07:12:09Z) - SVDM: Single-View Diffusion Model for Pseudo-Stereo 3D Object Detection [0.0]
Pseudo-Stereoに基づくモノクル3D検出のためのフレームワークが最近提案され、コミュニティで注目されている。
本研究では,単一視点拡散モデルを導入することで,エンドツーエンドで効率的な擬似ステレオ3D検出フレームワークを提案する。
SVDMは擬似ステレオ3D検出パイプライン全体をエンドツーエンドで訓練することができ、ステレオ検出器の訓練の恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-07-05T13:10:37Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z) - The Devil is in the Task: Exploiting Reciprocal Appearance-Localization
Features for Monocular 3D Object Detection [62.1185839286255]
低コストのモノクル3D物体検出は、自律運転において基本的な役割を果たす。
DFR-Netという動的特徴反射ネットワークを導入する。
我々は、KITTIテストセットの全ての単分子3D物体検出器の中で、第1位にランク付けする。
論文 参考訳(メタデータ) (2021-12-28T07:31:18Z) - MonoGRNet: A General Framework for Monocular 3D Object Detection [23.59839921644492]
幾何学的推論によるモノクロ画像からのアモーダル3次元物体検出のためのMonoGRNetを提案する。
MonoGRNetは、モノラル3Dオブジェクト検出タスクを2Dオブジェクト検出、インスタンスレベルの深さ推定、投影された3Dセンター推定、ローカルコーナー回帰を含む4つのサブタスクに分解する。
KITTI、Cityscapes、MS COCOデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-04-18T10:07:52Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。