論文の概要: 3D Video Object Detection with Learnable Object-Centric Global
Optimization
- arxiv url: http://arxiv.org/abs/2303.15416v1
- Date: Mon, 27 Mar 2023 17:39:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 14:08:35.302756
- Title: 3D Video Object Detection with Learnable Object-Centric Global
Optimization
- Title(参考訳): 学習可能なオブジェクト中心グローバル最適化による3次元映像オブジェクト検出
- Authors: Jiawei He, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang
- Abstract要約: 対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
- 参考スコア(独自算出の注目度): 65.68977894460222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore long-term temporal visual correspondence-based optimization for 3D
video object detection in this work. Visual correspondence refers to one-to-one
mappings for pixels across multiple images. Correspondence-based optimization
is the cornerstone for 3D scene reconstruction but is less studied in 3D video
object detection, because moving objects violate multi-view geometry
constraints and are treated as outliers during scene reconstruction. We address
this issue by treating objects as first-class citizens during
correspondence-based optimization. In this work, we propose BA-Det, an
end-to-end optimizable object detector with object-centric temporal
correspondence learning and featuremetric object bundle adjustment.
Empirically, we verify the effectiveness and efficiency of BA-Det for multiple
baseline 3D detectors under various setups. Our BA-Det achieves SOTA
performance on the large-scale Waymo Open Dataset (WOD) with only marginal
computation cost. Our code is available at
https://github.com/jiaweihe1996/BA-Det.
- Abstract(参考訳): 本研究では3次元映像オブジェクト検出のための時間的視覚対応に基づく長期的最適化について検討する。
視覚対応とは、複数の画像にまたがるピクセルの1対1マッピングを指す。
対応性に基づく最適化は3次元シーン再構成の基盤となるが,移動物体が複数ビューの幾何学的制約に反し,シーン再構成の際には外れ値として扱われるため,3次元ビデオオブジェクト検出においてあまり研究されていない。
通信方式の最適化において,オブジェクトを第一級市民として扱うことでこの問題に対処する。
本研究では,対象中心時間対応学習と特徴量オブジェクトバンドル調整を備えた,エンドツーエンドの最適化可能な物体検出器ba-detを提案する。
実験により,複数のベースライン3D検出器におけるBA-Detの有効性と有効性を検証する。
我々のBA-Detは,大規模Waymo Open Dataset(WOD)上でのSOTA性能を限界計算コストのみで達成している。
私たちのコードはhttps://github.com/jiaweihe1996/ba-detで利用可能です。
関連論文リスト
- 3DGS-CD: 3D Gaussian Splatting-based Change Detection for Physical Object Rearrangement [2.2122801766964795]
3DGS-CDは3Dシーンにおける物体の物理的配置を検出する最初の3Dガウス散乱(3DGS)に基づく手法である。
提案手法では,異なる時間に撮影された2つの不整合画像を比較して3次元オブジェクトレベルの変化を推定する。
本手法は,18秒以内のスパース・ポスト・チェンジ画像を用いて,1枚の新しい画像のみを用いて,散在する環境の変化を検出できる。
論文 参考訳(メタデータ) (2024-11-06T07:08:41Z) - SOGDet: Semantic-Occupancy Guided Multi-view 3D Object Detection [19.75965521357068]
本稿では,SOGDet(Semantic-Occupancy Guided Multi-view Object Detection)と呼ばれる新しい手法を提案する。
以上の結果から,SOGDet は nuScenes Detection Score (NDS) と平均平均精度 (mAP) の3つのベースライン法の性能を一貫して向上させることがわかった。
これは、3Dオブジェクト検出と3Dセマンティック占有の組み合わせが、3D環境をより包括的に認識し、より堅牢な自律運転システムの構築を支援することを示唆している。
論文 参考訳(メタデータ) (2023-08-26T07:38:21Z) - Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。