論文の概要: GMM: Delving into Gradient Aware and Model Perceive Depth Mining for
Monocular 3D Detection
- arxiv url: http://arxiv.org/abs/2306.17450v1
- Date: Fri, 30 Jun 2023 07:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 13:25:33.226195
- Title: GMM: Delving into Gradient Aware and Model Perceive Depth Mining for
Monocular 3D Detection
- Title(参考訳): GMM:モノクロ3次元検出のためのグラディエント・アウェアとモデル知覚深度マイニング
- Authors: Weixin Mao, Jinrong Yang, Zheng Ge, Lin Song, Hongyu Zhou, Tiezheng
Mao, Zeming Li, Osamu Yoshie
- Abstract要約: 本研究では,3次元物体検出における深度知覚を改善するための簡易かつ効果的なマイニング手法を提案する。
本稿では,モデルのマイニングサンプルを選択する深度予測の精度を評価するための指標を提案する。
また、深度学習のためのグラディエント・アウェア・モデル知覚マイニング戦略(GMM)を提案する。
- 参考スコア(独自算出の注目度): 29.33386761421999
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depth perception is a crucial component of monoc-ular 3D detection tasks that
typically involve ill-posed problems. In light of the success of sample mining
techniques in 2D object detection, we propose a simple yet effective mining
strategy for improving depth perception in 3D object detection. Concretely, we
introduce a plain metric to evaluate the quality of depth predictions, which
chooses the mined sample for the model. Moreover, we propose a Gradient-aware
and Model-perceive Mining strategy (GMM) for depth learning, which exploits the
predicted depth quality for better depth learning through easy mining. GMM is a
general strategy that can be readily applied to several state-of-the-art
monocular 3D detectors, improving the accuracy of depth prediction. Extensive
experiments on the nuScenes dataset demonstrate that the proposed methods
significantly improve the performance of 3D object detection while
outperforming other state-of-the-art sample mining techniques by a considerable
margin. On the nuScenes benchmark, GMM achieved the state-of-the-art (42.1% mAP
and 47.3% NDS) performance in monocular object detection.
- Abstract(参考訳): 深度知覚は、通常不適切な問題を伴う単眼の3d検出タスクの重要な要素である。
2次元物体検出におけるサンプルマイニング手法の成功を踏まえ,3次元物体検出における奥行き知覚を改善するための簡易かつ効果的なマイニング戦略を提案する。
具体的には,モデルから抽出したサンプルを選択する深さ予測の質を評価するための平易な指標を提案する。
さらに,深層学習のための勾配認識型モデル知覚型マイニング戦略 (gmm) を提案する。
GMMは、最先端のモノクル3D検出器に容易に適用可能な一般的な戦略であり、深度予測の精度を向上させる。
nuscenesデータセットに関する広範囲な実験により、提案手法は3dオブジェクト検出の性能を大幅に向上させ、他の最先端サンプルマイニング技術を大きく上回ることを示した。
nuScenesベンチマークでは、GMMはモノクロ物体の検出において最先端(42.1% mAPと47.3% NDS)の性能を達成した。
関連論文リスト
- ODM3D: Alleviating Foreground Sparsity for Semi-Supervised Monocular 3D
Object Detection [15.204935788297226]
ODM3Dフレームワークは、トレーニング中にLiDARドメインの知識を単分子検出器に注入するために、様々なレベルでのクロスモーダルな知識蒸留を必要とする。
既存手法の準最適トレーニングの主要因として,前景の空間空間を同定することにより,LiDAR点に埋め込まれた正確な位置化情報を活用する。
KITTI検証とテストベンチマークの両方で1位にランクインし、教師付きまたは半教師付きである既存のモノクラー手法をはるかに上回っている。
論文 参考訳(メタデータ) (2023-10-28T07:12:09Z) - IDMS: Instance Depth for Multi-scale Monocular 3D Object Detection [1.7710335706046505]
拡張畳み込みに基づくマルチスケール認識モジュールは、異なるスケールターゲットに対するモデルの処理能力を向上するために設計されている。
提案アルゴリズムをKITTIテストセットと評価セットで検証することにより,実験結果から,車種別AP40の5.27%の改善が得られた。
論文 参考訳(メタデータ) (2022-12-03T04:02:31Z) - Depth Estimation Matters Most: Improving Per-Object Depth Estimation for
Monocular 3D Detection and Tracking [47.59619420444781]
検出・追跡を含む単眼的3D知覚へのアプローチは、LiDARベースの手法と比較して性能が劣ることが多い。
本稿では,オブジェクト(トラックレット)の複数のフレームに異なる表現(RGBと擬似LiDAR)と時間情報を組み合わせた多層融合手法を提案する。
論文 参考訳(メタデータ) (2022-06-08T03:37:59Z) - MDS-Net: A Multi-scale Depth Stratification Based Monocular 3D Object
Detection Algorithm [4.958840734249869]
本論文では,マルチスケール深度層構造に基づく1段モノクロ3次元物体検出アルゴリズムを提案する。
KITTIベンチマークの実験では、MDS-Netは既存のモノクル3D検出方法よりも3D検出やBEV検出タスクに優れていた。
論文 参考訳(メタデータ) (2022-01-12T07:11:18Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - Aug3D-RPN: Improving Monocular 3D Object Detection by Synthetic Images
with Virtual Depth [64.29043589521308]
仮想深度で画像を合成することでトレーニングデータを増強するレンダリングモジュールを提案する。
レンダリングモジュールは、RGB画像と対応するスパース深度画像とを入力として、さまざまなフォトリアリスティック合成画像を出力する。
さらに,深度推定タスクを通じて共同で最適化することで,検出モデルを改善する補助モジュールを導入する。
論文 参考訳(メタデータ) (2021-07-28T11:00:47Z) - MonoGRNet: A General Framework for Monocular 3D Object Detection [23.59839921644492]
幾何学的推論によるモノクロ画像からのアモーダル3次元物体検出のためのMonoGRNetを提案する。
MonoGRNetは、モノラル3Dオブジェクト検出タスクを2Dオブジェクト検出、インスタンスレベルの深さ推定、投影された3Dセンター推定、ローカルコーナー回帰を含む4つのサブタスクに分解する。
KITTI、Cityscapes、MS COCOデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-04-18T10:07:52Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。