論文の概要: Are we Missing Confidence in Pseudo-LiDAR Methods for Monocular 3D
Object Detection?
- arxiv url: http://arxiv.org/abs/2012.05796v2
- Date: Thu, 13 May 2021 11:46:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 06:20:54.029101
- Title: Are we Missing Confidence in Pseudo-LiDAR Methods for Monocular 3D
Object Detection?
- Title(参考訳): 擬似LiDAR法によるモノクロ3次元物体検出における信頼の欠如
- Authors: Andrea Simonelli, Samuel Rota Bul\`o, Lorenzo Porzi, Peter
Kontschieder, Elisa Ricci
- Abstract要約: 実験により,plベース手法による検証結果が実質的に偏っていることを示す。
3D信頼度予測モジュールを導入する新しい深層アーキテクチャを紹介します。
rgbのみの3d検出手法から得られた3次元信頼度推定手法をフレームワークにうまく統合できることを示す。
- 参考スコア(独自算出の注目度): 44.74595167179931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pseudo-LiDAR-based methods for monocular 3D object detection have received
considerable attention in the community due to the performance gains exhibited
on the KITTI3D benchmark, in particular on the commonly reported validation
split. This generated a distorted impression about the superiority of
Pseudo-LiDAR-based (PL-based) approaches over methods working with RGB images
only. Our first contribution consists in rectifying this view by pointing out
and showing experimentally that the validation results published by PL-based
methods are substantially biased. The source of the bias resides in an overlap
between the KITTI3D object detection validation set and the training/validation
sets used to train depth predictors feeding PL-based methods. Surprisingly, the
bias remains also after geographically removing the overlap. This leaves the
test set as the only reliable set for comparison, where published PL-based
methods do not excel. Our second contribution brings PL-based methods back up
in the ranking with the design of a novel deep architecture which introduces a
3D confidence prediction module. We show that 3D confidence estimation
techniques derived from RGB-only 3D detection approaches can be successfully
integrated into our framework and, more importantly, that improved performance
can be obtained with a newly designed 3D confidence measure, leading to
state-of-the-art performance on the KITTI3D benchmark.
- Abstract(参考訳): 擬似LiDARを用いたモノクロ3Dオブジェクト検出法は,KITTI3Dベンチマークで示された性能向上により,コミュニティで注目されている。
これにより、RGB画像のみを扱う手法よりもPseudo-LiDAR(PLベース)アプローチの方が優れているという歪んだ印象が生じる。
最初のコントリビューションは、plベースのメソッドが公開する検証結果が実質的に偏っていることを指摘し、実験的に示すことで、この見解を正すことにあります。
バイアスの源は、KITTI3Dオブジェクト検出検証セットと、PLベースの方法を提供する深度予測器のトレーニングに使用されるトレーニング/バリデーションセットの重複に存在する。
驚いたことに、このバイアスは地理的に重複を取り除いた後にも残る。
このことは、PLベースのメソッドが排他的でないテストセットを唯一信頼できる比較セットとして残している。
2つ目のコントリビューションは、PLベースのメソッドを3D信頼度予測モジュールを導入した新しいディープアーキテクチャの設計とともにランキングに戻すことです。
rgbのみの3d検出アプローチから得られた3d信頼度推定手法をフレームワークに統合し,さらに,新たに設計した3d信頼度尺度で性能改善が得られ,kitti3dベンチマークで最先端のパフォーマンスが得られた。
関連論文リスト
- Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - OriCon3D: Effective 3D Object Detection using Orientation and Confidence [0.0]
1つの画像から3次元物体を検出するための高度な手法を提案する。
我々は、深層畳み込みニューラルネットワークに基づく3Dオブジェクト重み付け指向回帰パラダイムを用いる。
提案手法は, 3次元オブジェクトのポーズ決定の精度を大幅に向上し, ベースライン法を超越した。
論文 参考訳(メタデータ) (2023-04-27T19:52:47Z) - DATa: Domain Adaptation-Aided Deep Table Detection Using Visual-Lexical
Representations [2.542864854772221]
DATaと呼ばれる新しいドメイン適応型ディープテーブル検出手法を提案する。
信頼できるラベルがほとんどない特定のターゲットドメインで十分なパフォーマンスを保証します。
実験の結果,DATaは対象領域における視覚的表現のみを利用する競合手法よりもかなり優れていた。
論文 参考訳(メタデータ) (2022-11-12T12:14:16Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z) - Advancing Self-supervised Monocular Depth Learning with Sparse LiDAR [22.202192422883122]
本稿では,自己教師付き単分子深度学習を推進するための2段階ネットワークを提案する。
本モデルでは,単色画像特徴と疎LiDAR特徴を融合させて初期深度マップを推定する。
我々のモデルは、下流タスクのモノクロ3Dオブジェクト検出において、最先端のスパース-LiDAR法(Pseudo-LiDAR++)を68%以上向上させる。
論文 参考訳(メタデータ) (2021-09-20T15:28:36Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。