論文の概要: ORA3D: Overlap Region Aware Multi-view 3D Object Detection
- arxiv url: http://arxiv.org/abs/2207.00865v1
- Date: Sat, 2 Jul 2022 15:28:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 10:14:51.551449
- Title: ORA3D: Overlap Region Aware Multi-view 3D Object Detection
- Title(参考訳): ORA3D:マルチビュー3Dオブジェクト検出を意識したオーバーラップ領域
- Authors: Wonseok Roh, Gyusam Chang, Seokha Moon, Giljoo Nam, Chanyoung Kim,
Younghyun Kim, Sangpil Kim, Jinkyu Kim
- Abstract要約: 現在の多視点3Dオブジェクト検出法は、しばしば重なり合う領域のオブジェクトを適切に検出できない。
本稿では,従来のステレオ不均質推定手法を適用し,重なり合う領域に対する信頼性の高い不均質情報を得る。
また,非重なり領域と重なり領域との表現的ギャップを最小限に抑えるために,逆重なり領域判別器を提案する。
- 参考スコア(独自算出の注目度): 11.587465967682732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In multi-view 3D object detection tasks, disparity supervision over
overlapping image regions substantially improves the overall detection
performance. However, current multi-view 3D object detection methods often fail
to detect objects in the overlap region properly, and the network's
understanding of the scene is often limited to that of a monocular detection
network. To mitigate this issue, we advocate for applying the traditional
stereo disparity estimation method to obtain reliable disparity information for
the overlap region. Given the disparity estimates as a supervision, we propose
to regularize the network to fully utilize the geometric potential of binocular
images, and improve the overall detection accuracy. Moreover, we propose to use
an adversarial overlap region discriminator, which is trained to minimize the
representational gap between non-overlap regions and overlapping regions where
objects are often largely occluded or suffer from deformation due to camera
distortion, causing a domain shift. We demonstrate the effectiveness of the
proposed method with the large-scale multi-view 3D object detection benchmark,
called nuScenes. Our experiment shows that our proposed method outperforms the
current state-of-the-art methods.
- Abstract(参考訳): 多視点3Dオブジェクト検出タスクでは、重複する画像領域に対する差分監督が全体的な検出性能を大幅に向上させる。
しかし、現在のマルチビュー3Dオブジェクト検出手法では、重複領域のオブジェクトを適切に検出できないことが多く、シーンに対するネットワークの理解は単眼で検出するネットワークに限られることが多い。
この問題を軽減するために,従来のステレオ不均質推定法を適用して,重なり合う領域に対する信頼性の高い不均質情報を求める。
両眼画像の幾何学的ポテンシャルをフル活用し、全体的な検出精度を向上させるために、ネットワークを正規化することを提案する。
さらに,非オーバーラップ領域と重なり領域間の表現ギャップを最小限に抑えるように訓練した逆重なり領域判別器を用いる。
提案手法の有効性を, nuScenes と呼ばれる大規模マルチビュー3次元オブジェクト検出ベンチマークを用いて実証する。
提案手法が現在の最先端手法よりも優れていることを示す。
関連論文リスト
- 3D Semantic Segmentation-Driven Representations for 3D Object Detection [0.9790236766474201]
自動運転において、3D検出は、経路計画や動き推定など、下流のタスクにより正確な情報を提供する。
提案したマルチモーダル3Dオブジェクト検出は,画像から得られる意味的特徴と点雲から得られる幾何学的特徴を組み合わせたものである。
我々は,既存のLiDARのみに基づく3D検出の十分な意味情報を確保するためのプレゼンテーションとして,ポイントワイズ・セマンティック機能であるSeSameを提案する。
論文 参考訳(メタデータ) (2024-03-11T08:17:56Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - SVDM: Single-View Diffusion Model for Pseudo-Stereo 3D Object Detection [0.0]
Pseudo-Stereoに基づくモノクル3D検出のためのフレームワークが最近提案され、コミュニティで注目されている。
本研究では,単一視点拡散モデルを導入することで,エンドツーエンドで効率的な擬似ステレオ3D検出フレームワークを提案する。
SVDMは擬似ステレオ3D検出パイプライン全体をエンドツーエンドで訓練することができ、ステレオ検出器の訓練の恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-07-05T13:10:37Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - MonoGRNet: A General Framework for Monocular 3D Object Detection [23.59839921644492]
幾何学的推論によるモノクロ画像からのアモーダル3次元物体検出のためのMonoGRNetを提案する。
MonoGRNetは、モノラル3Dオブジェクト検出タスクを2Dオブジェクト検出、インスタンスレベルの深さ推定、投影された3Dセンター推定、ローカルコーナー回帰を含む4つのサブタスクに分解する。
KITTI、Cityscapes、MS COCOデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-04-18T10:07:52Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。