論文の概要: Detecting As Labeling: Rethinking LiDAR-camera Fusion in 3D Object
Detection
- arxiv url: http://arxiv.org/abs/2311.07152v1
- Date: Mon, 13 Nov 2023 08:47:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 15:15:45.670873
- Title: Detecting As Labeling: Rethinking LiDAR-camera Fusion in 3D Object
Detection
- Title(参考訳): 3次元物体検出におけるLiDAR-camera Fusionの再考
- Authors: Junjie Huang, Yun Ye, Zhujin Liang, Yi Shan, and Dalong Du
- Abstract要約: LiDARカメラによる3次元物体検出は、アルゴリズム開発において過度に適合する。
DALと呼ばれる新しいパラダイムを提案する。
DALは性能境界を実質的に押し上げ、速度と精度のトレードオフが優れている。
- 参考スコア(独自算出の注目度): 18.032103701664333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D object Detection with LiDAR-camera encounters overfitting in algorithm
development which is derived from the violation of some fundamental rules. We
refer to the data annotation in dataset construction for theory complementing
and argue that the regression task prediction should not involve the feature
from the camera branch. By following the cutting-edge perspective of 'Detecting
As Labeling', we propose a novel paradigm dubbed DAL. With the most classical
elementary algorithms, a simple predicting pipeline is constructed by imitating
the data annotation process. Then we train it in the simplest way to minimize
its dependency and strengthen its portability. Though simple in construction
and training, the proposed DAL paradigm not only substantially pushes the
performance boundary but also provides a superior trade-off between speed and
accuracy among all existing methods. With comprehensive superiority, DAL is an
ideal baseline for both future work development and practical deployment. The
code has been released to facilitate future work on
https://github.com/HuangJunJie2017/BEVDet.
- Abstract(参考訳): LiDARカメラを用いた3Dオブジェクト検出は,いくつかの基本規則違反から生じるアルゴリズム開発において過度に適合する。
理論的補完のためのデータセット構築におけるデータアノテーションを参照し、回帰タスク予測はカメラブランチの機能を含まないべきだと主張する。
ラベル検出」という最先端の視点に従えば,dalと呼ばれる新しいパラダイムを提案する。
最も古典的な基本アルゴリズムでは、データアノテーションプロセスを模倣して単純な予測パイプラインを構築する。
そして、依存関係を最小化し、ポータビリティを強化するために、最も簡単な方法でトレーニングします。
構成と訓練は単純だが,提案したDALパラダイムは性能境界を大幅に推し進めるだけでなく,既存の手法間の速度と精度のトレードオフも優れている。
包括的な優位性によって、DALは将来の開発と実践的なデプロイメントの両方に理想的なベースラインとなります。
コードはhttps://github.com/huangjunjie2017/bevdetの今後の作業を容易にするためにリリースされた。
関連論文リスト
- Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。
近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。
組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T15:21:57Z) - Robust 3D Object Detection from LiDAR-Radar Point Clouds via Cross-Modal
Feature Augmentation [7.364627166256136]
本稿では,点雲からの3次元物体検出のための新しい枠組みを提案する。
背骨の微細化と幻覚発生を同時に行うために,空間的および特徴的に複数のアライメントを導入する。
View-of-Delftデータセットの実験により,提案手法は,レーダとLiDARの両方のオブジェクト検出において,最先端(SOTA)手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-09-29T15:46:59Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Exploring Simple 3D Multi-Object Tracking for Autonomous Driving [10.921208239968827]
LiDARポイントクラウドにおける3Dマルチオブジェクトトラッキングは、自動運転車にとって重要な要素である。
既存の手法は、主にトラッキング・バイ・検出パイプラインに基づいており、検出アソシエーションのマッチングステップが必然的に必要である。
我々は,手作りの追跡パラダイムをシンプルにするために,原点雲からの共同検出と追跡のためのエンドツーエンドのトレーニング可能なモデルを提案する。
論文 参考訳(メタデータ) (2021-08-23T17:59:22Z) - LiDAR R-CNN: An Efficient and Universal 3D Object Detector [20.17906188581305]
自動運転の知覚システムには、LiDARベースの3D検出が欠かせません。
lidar r-cnnは,既存の3d検出器を改良できる第2段検出器である。
特に、PointPillarsの1つのバリエーションに基づいて、私たちの方法は小さなコストで新しい最先端の結果を達成できます。
論文 参考訳(メタデータ) (2021-03-29T03:01:21Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。