論文の概要: Monocular 3D Object Detection with Bounding Box Denoising in 3D by
Perceiver
- arxiv url: http://arxiv.org/abs/2304.01289v1
- Date: Mon, 3 Apr 2023 18:24:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 16:45:38.768021
- Title: Monocular 3D Object Detection with Bounding Box Denoising in 3D by
Perceiver
- Title(参考訳): 知覚者による3次元における境界ボックスによる単眼3次元物体検出
- Authors: Xianpeng Liu, Ce Zheng, Kelvin Cheng, Nan Xue, Guo-Jun Qi, Tianfu Wu
- Abstract要約: モノクル3D物体検出の主な課題は、3D中心の正確な位置決めである。
本稿では,2次元から3次元への情報フローと3次元から2次元への情報フローを組み合わせた段階的アプローチを提案する。
提案手法はMonoXiverと命名され, 背骨単分子3D検出器に容易に適用可能である。
- 参考スコア(独自算出の注目度): 45.16079927526731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The main challenge of monocular 3D object detection is the accurate
localization of 3D center. Motivated by a new and strong observation that this
challenge can be remedied by a 3D-space local-grid search scheme in an ideal
case, we propose a stage-wise approach, which combines the information flow
from 2D-to-3D (3D bounding box proposal generation with a single 2D image) and
3D-to-2D (proposal verification by denoising with 3D-to-2D contexts) in a
top-down manner. Specifically, we first obtain initial proposals from
off-the-shelf backbone monocular 3D detectors. Then, we generate a 3D anchor
space by local-grid sampling from the initial proposals. Finally, we perform 3D
bounding box denoising at the 3D-to-2D proposal verification stage. To
effectively learn discriminative features for denoising highly overlapped
proposals, this paper presents a method of using the Perceiver I/O model to
fuse the 3D-to-2D geometric information and the 2D appearance information. With
the encoded latent representation of a proposal, the verification head is
implemented with a self-attention module. Our method, named as MonoXiver, is
generic and can be easily adapted to any backbone monocular 3D detectors.
Experimental results on the well-established KITTI dataset and the challenging
large-scale Waymo dataset show that MonoXiver consistently achieves improvement
with limited computation overhead.
- Abstract(参考訳): 単眼3次元物体検出の主な課題は3次元中心の正確な位置決めである。
理想的な場合において,この課題を3次元空間の局所グリッド探索方式で修復できるという新たな強みに感化されて,2次元から3次元までの情報フローと3次元から2次元のコンテキストを重畳した3次元から2次元までの情報フローを組み合わせたステージワイズ手法を提案する。
具体的には、まず、市販のバックボーン単分子3D検出器から最初の提案を得る。
次に,初期提案から局所グリッドサンプリングにより3次元アンカー空間を生成する。
最後に、3D-to-2D提案の検証段階で3Dバウンディングボックスをデノナイズする。
本稿では,重なり合う提案を識別する識別的特徴を効果的に学習するために,Perceiver I/Oモデルを用いて3次元から2次元の幾何学的情報と2次元の外観情報を融合させる手法を提案する。
提案のエンコードされた潜在表現により、検証ヘッドは自己アテンションモジュールで実装される。
提案手法はMonoXiverと命名され, 背骨単分子3D検出器に容易に適用可能である。
確立されたKITTIデータセットと挑戦的な大規模Waymoデータセットの実験結果から、MonoXiverは計算オーバーヘッドを制限して一貫して改善を達成している。
関連論文リスト
- MonoNeRD: NeRF-like Representations for Monocular 3D Object Detection [31.58403386994297]
我々は,高密度な3次元形状と占有度を推定できる新しい検出フレームワークMonoNeRDを提案する。
具体的には、SDF(Signed Distance Function)を用いてシーンをモデル化し、密集した3D表現の作成を容易にする。
我々の知る限り、この研究は初めてM3Dのボリュームレンダリングを導入し、画像に基づく3D知覚のための暗黙的な再構築の可能性を示す。
論文 参考訳(メタデータ) (2023-08-18T09:39:52Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - FGR: Frustum-Aware Geometric Reasoning for Weakly Supervised 3D Vehicle
Detection [81.79171905308827]
3Dアノテーションを使わずに点雲中の車両を検出するためのフラストラム対応幾何推論(FGR)を提案する。
本手法は粗い3次元セグメンテーションと3次元バウンディングボックス推定の2段階からなる。
2Dバウンディングボックスとスパースポイントクラウドだけで、3D空間内のオブジェクトを正確に検出できます。
論文 参考訳(メタデータ) (2021-05-17T07:29:55Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z) - MonoGRNet: A General Framework for Monocular 3D Object Detection [23.59839921644492]
幾何学的推論によるモノクロ画像からのアモーダル3次元物体検出のためのMonoGRNetを提案する。
MonoGRNetは、モノラル3Dオブジェクト検出タスクを2Dオブジェクト検出、インスタンスレベルの深さ推定、投影された3Dセンター推定、ローカルコーナー回帰を含む4つのサブタスクに分解する。
KITTI、Cityscapes、MS COCOデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-04-18T10:07:52Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Object-Aware Centroid Voting for Monocular 3D Object Detection [30.59728753059457]
本研究では, 深度を学習することなく, 終端から終端までトレーニング可能な単分子3次元物体検出器を提案する。
領域的外見の注意と幾何学的射影分布の両面を考慮した,新しいオブジェクト認識型投票手法が導入された。
遅延融合と予測される3D方向と次元により、オブジェクトの3D境界ボックスは単一のRGB画像から検出できる。
論文 参考訳(メタデータ) (2020-07-20T02:11:18Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。