論文の概要: Monocular 3D Object Detection: An Extrinsic Parameter Free Approach
- arxiv url: http://arxiv.org/abs/2106.15796v1
- Date: Wed, 30 Jun 2021 03:35:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 15:33:45.163880
- Title: Monocular 3D Object Detection: An Extrinsic Parameter Free Approach
- Title(参考訳): 特異な3次元物体検出:外因性パラメータフリーアプローチ
- Authors: Yunsong Zhou, Yuan He, Hongzi Zhu, Cheng Wang, Hongyang Li, Qinhong
Jiang
- Abstract要約: 本稿では、外乱のない検出器を定式化するために、カメラのポーズをキャプチャする新しい方法を提案する。
コンバータは、潜伏空間における摂動特性を補正するように設計されている。
実験により,本手法が他の最先端技術と比較して最高の性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 29.723079686571825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D object detection is an important task in autonomous driving. It
can be easily intractable where there exists ego-car pose change w.r.t. ground
plane. This is common due to the slight fluctuation of road smoothness and
slope. Due to the lack of insight in industrial application, existing methods
on open datasets neglect the camera pose information, which inevitably results
in the detector being susceptible to camera extrinsic parameters. The
perturbation of objects is very popular in most autonomous driving cases for
industrial products. To this end, we propose a novel method to capture camera
pose to formulate the detector free from extrinsic perturbation. Specifically,
the proposed framework predicts camera extrinsic parameters by detecting
vanishing point and horizon change. A converter is designed to rectify
perturbative features in the latent space. By doing so, our 3D detector works
independent of the extrinsic parameter variations and produces accurate results
in realistic cases, e.g., potholed and uneven roads, where almost all existing
monocular detectors fail to handle. Experiments demonstrate our method yields
the best performance compared with the other state-of-the-arts by a large
margin on both KITTI 3D and nuScenes datasets.
- Abstract(参考訳): モノクロ3D物体検出は自動運転において重要な課題である。
ego-car pose change w.r.t が存在する場合、容易に難解である。
地上機。
これは、道路の滑らかさと斜面がわずかに変動することによる。
産業応用における洞察の欠如により、既存のオープンデータセットの手法ではカメラのポーズ情報を無視しており、カメラの外部パラメータに影響を受けやすい。
オブジェクトの摂動は、工業製品のほとんどの自動運転ケースで非常に人気がある。
そこで本研究では,カメラのポーズを捉え,外乱のない検出器を定式化する手法を提案する。
具体的には, 消失点と地平線変化を検知することで, カメラの異常パラメータを予測する。
変換器は潜在空間における摂動特性を正すように設計されている。
これにより、我々の3D検出器は、外在パラメータのばらつきとは独立して動作し、例えばポットホルドや不均一な道路などの現実的なケースで正確な結果をもたらす。
KITTI 3D と nuScenes の両方のデータセットにおいて,本手法が他の最先端技術と比較して高い性能を示すことを示す実験を行った。
関連論文リスト
- Rotation Matters: Generalized Monocular 3D Object Detection for Various
Camera Systems [15.47493325786152]
トレーニングデータセットをキャプチャするシステムとは異なるカメラシステムに適用した場合、3Dオブジェクト検出性能は大幅に低下する。
乗客の車のデータセットに基づいて訓練された3D検出器は、バスに搭載されたカメラの正確な3Dバウンディングボックスを後退させるのにほとんど失敗する。
本稿では,様々なカメラシステムに適用可能な汎用3次元物体検出手法を提案する。
論文 参考訳(メタデータ) (2023-10-09T02:52:22Z) - Tame a Wild Camera: In-the-Wild Monocular Camera Calibration [12.55056916519563]
以前のモノクロカメラのキャリブレーション法は、特定の3Dオブジェクトやそれ以前の強力な幾何学に依存していた。
提案手法は仮定フリーであり,Def(Degree-of-Freedom)固有のパラメータを4ドル(約4,400円)で校正する。
画像操作検出と復元,2次元ポーズ推定,3次元センシングにおける下流の応用を実証する。
論文 参考訳(メタデータ) (2023-06-19T14:55:26Z) - Multi-Modal 3D Object Detection by Box Matching [109.43430123791684]
マルチモーダル3次元検出のためのボックスマッチング(FBMNet)による新しいフュージョンネットワークを提案する。
3Dオブジェクトと2Dオブジェクトの提案を学習することで、ROI特徴を組み合わせることで、検出のための融合を効果的に行うことができる。
論文 参考訳(メタデータ) (2023-05-12T18:08:51Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Rope3D: TheRoadside Perception Dataset for Autonomous Driving and
Monocular 3D Object Detection Task [48.555440807415664]
道路沿いの知覚3Dデータセットに挑戦する最初のハイダイバーシティを提示する。
データセットは50Kイメージと、さまざまなシーンで1.5M以上の3Dオブジェクトで構成されている。
本稿では,様々なセンサや視点によって引き起こされるあいまいさを解決するために,幾何学的制約を活用することを提案する。
論文 参考訳(メタデータ) (2022-03-25T12:13:23Z) - 3D-VField: Learning to Adversarially Deform Point Clouds for Robust 3D
Object Detection [111.32054128362427]
安全クリティカルな環境では、アウト・オブ・ディストリビューションとロングテールサンプルの堅牢性は、危険な問題を回避するのに不可欠である。
トレーニング中の変形点雲を考慮した3次元物体検出器の領域外データへの一般化を著しく改善する。
我々は、リアルに損傷を受けた稀な車の合成データセットであるCrashDを提案し、共有する。
論文 参考訳(メタデータ) (2021-12-09T08:50:54Z) - MonoCInIS: Camera Independent Monocular 3D Object Detection using
Instance Segmentation [55.96577490779591]
大規模で異質なトレーニングデータを活用するためには、"カメラ独立"の度合いが必要である。
大規模で異質なトレーニングデータの恩恵を受けるためには、より多くのデータがパフォーマンスを自動で保証するのではなく、"カメラ独立"の度合いを持つ必要がある。
論文 参考訳(メタデータ) (2021-10-01T14:56:37Z) - Gated3D: Monocular 3D Object Detection From Temporal Illumination Cues [28.806932489163888]
低コストな単分子ゲート型画像処理装置から時間的照度を利用した新しい3次元物体検出法を提案する。
提案手法は,1万km以上の運転データから得られたゲート画像を含む新しい3次元検出データセットを用いて評価する。
論文 参考訳(メタデータ) (2021-02-06T16:06:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。