論文の概要: MVM3Det: A Novel Method for Multi-view Monocular 3D Detection
- arxiv url: http://arxiv.org/abs/2109.10473v1
- Date: Wed, 22 Sep 2021 01:31:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 22:21:30.085925
- Title: MVM3Det: A Novel Method for Multi-view Monocular 3D Detection
- Title(参考訳): MVM3Det:マルチビューモノクロ3次元検出のための新しい方法
- Authors: Li Haoran and Duan Zicheng and Ma Mingjun and Chen Yaran and Li Jiaqi
and Zhao Dongbin
- Abstract要約: MVM3Detは、多視点単眼情報に基づいて、オブジェクトの3次元位置と向きを同時に推定する。
MVM3Dというマルチビュー3Dオブジェクト検出のための最初のデータセットを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D object detection encounters occlusion problems in many
application scenarios, such as traffic monitoring, pedestrian monitoring, etc.,
which leads to serious false negative. Multi-view object detection effectively
solves this problem by combining data from different perspectives. However, due
to label confusion and feature confusion, the orientation estimation of
multi-view 3D object detection is intractable, which is important for object
tracking and intention prediction. In this paper, we propose a novel multi-view
3D object detection method named MVM3Det which simultaneously estimates the 3D
position and orientation of the object according to the multi-view monocular
information. The method consists of two parts: 1) Position proposal network,
which integrates the features from different perspectives into consistent
global features through feature orthogonal transformation to estimate the
position. 2) Multi-branch orientation estimation network, which introduces
feature perspective pooling to overcome the two confusion problems during the
orientation estimation. In addition, we present a first dataset for multi-view
3D object detection named MVM3D. Comparing with State-Of-The-Art (SOTA) methods
on our dataset and public dataset WildTrack, our method achieves very
competitive results.
- Abstract(参考訳): 単眼の3Dオブジェクト検出は,交通監視や歩行者監視など,多くのアプリケーションシナリオにおいて排他的問題に遭遇し,重大な偽陰性を引き起こす。
マルチビューオブジェクト検出は、異なる視点のデータを組み合わせて、効果的にこの問題を解決します。
しかし,ラベルの混乱や特徴の混乱により,多視点3次元物体検出の方向推定は難解であり,対象追跡や意図予測に重要である。
本論文では,多視点単眼情報に基づいて物体の位置と向きを同時に推定するマルチビュー3次元物体検出法であるmvm3detを提案する。
方法は2つの部分からなる。
1)異なる視点から特徴を一貫したグローバルな特徴に統合し,その位置を推定するための特徴直交変換を行う位置提案ネットワーク。
2) 向き推定中に2つの混乱問題を克服するために特徴点プーリングを導入するマルチブランチ方向推定ネットワーク。
さらに,マルチビュー3dオブジェクト検出のための最初のデータセットであるmvm3dを提案する。
我々のデータセットと公開データセットWildTrackのState-Of-The-Art(SOTA)メソッドと比較して,本手法は非常に競争力のある結果が得られる。
関連論文リスト
- Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - MMRDN: Consistent Representation for Multi-View Manipulation
Relationship Detection in Object-Stacked Scenes [62.20046129613934]
我々は,MMRDN(Multi-view MRD Network)と呼ばれる新しい多視点融合フレームワークを提案する。
異なるビューからの2Dデータを共通の隠れ空間に投影し、埋め込みをVon-Mises-Fisher分布に適合させる。
これら2つのオブジェクトの相対位置を符号化した各オブジェクト対の点雲から、K$最大垂直近傍点(KMVN)の集合を選択する。
論文 参考訳(メタデータ) (2023-04-25T05:55:29Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - A Simple Baseline for Multi-Camera 3D Object Detection [94.63944826540491]
周囲のカメラで3Dオブジェクトを検出することは、自動運転にとって有望な方向だ。
マルチカメラオブジェクト検出のための簡易ベースラインであるSimMODを提案する。
我々は, nuScenes の3次元オブジェクト検出ベンチマークにおいて, SimMOD の有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-08-22T03:38:01Z) - MonoGRNet: A General Framework for Monocular 3D Object Detection [23.59839921644492]
幾何学的推論によるモノクロ画像からのアモーダル3次元物体検出のためのMonoGRNetを提案する。
MonoGRNetは、モノラル3Dオブジェクト検出タスクを2Dオブジェクト検出、インスタンスレベルの深さ推定、投影された3Dセンター推定、ローカルコーナー回帰を含む4つのサブタスクに分解する。
KITTI、Cityscapes、MS COCOデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-04-18T10:07:52Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Relation3DMOT: Exploiting Deep Affinity for 3D Multi-Object Tracking
from View Aggregation [8.854112907350624]
3Dマルチオブジェクトトラッキングは、自律ナビゲーションにおいて重要な役割を果たす。
多くのアプローチでは、トラッキングのための2次元RGBシーケンス内のオブジェクトを検出するが、これは3次元空間内のオブジェクトをローカライズする際の信頼性の欠如である。
本稿では,隣接フレーム内の各オブジェクト間の相関をよりよく活用するために,RelationConvという新しい畳み込み演算を提案する。
論文 参考訳(メタデータ) (2020-11-25T16:14:40Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。