論文の概要: MaskBEV: Joint Object Detection and Footprint Completion for Bird's-eye
View 3D Point Clouds
- arxiv url: http://arxiv.org/abs/2307.01864v2
- Date: Tue, 1 Aug 2023 02:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 17:19:04.222718
- Title: MaskBEV: Joint Object Detection and Footprint Completion for Bird's-eye
View 3D Point Clouds
- Title(参考訳): MaskBEV:鳥眼視3D点雲のオブジェクト検出とフットプリント完了
- Authors: William Guimont-Martin, Jean-Michel Fortin, Fran\c{c}ois Pomerleau,
Philippe Gigu\`ere
- Abstract要約: MaskBEVは、BEV(Bird's-eye View)マスクベースの物体検出器ニューラルアーキテクチャである。
MaskBEVは検出されたオブジェクトのフットプリントを表す一連のBEVインスタンスマスクを予測する。
本研究では,Semantic KITTIデータセットとKITTIデータセットの両方でMaskBEVの性能を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent works in object detection in LiDAR point clouds mostly focus on
predicting bounding boxes around objects. This prediction is commonly achieved
using anchor-based or anchor-free detectors that predict bounding boxes,
requiring significant explicit prior knowledge about the objects to work
properly. To remedy these limitations, we propose MaskBEV, a bird's-eye view
(BEV) mask-based object detector neural architecture. MaskBEV predicts a set of
BEV instance masks that represent the footprints of detected objects. Moreover,
our approach allows object detection and footprint completion in a single pass.
MaskBEV also reformulates the detection problem purely in terms of
classification, doing away with regression usually done to predict bounding
boxes. We evaluate the performance of MaskBEV on both SemanticKITTI and KITTI
datasets while analyzing the architecture advantages and limitations.
- Abstract(参考訳): ライダーポイントクラウドにおける最近のオブジェクト検出の研究は、主にオブジェクト周辺の境界ボックスの予測に焦点を当てている。
この予測は通常、アンカーベースまたはアンカーフリーの検出器を使って境界ボックスを予測し、オブジェクトが適切に動作するための明確な事前知識を必要とする。
これらの制約を緩和するために,鳥眼ビュー (BEV) を用いた物体検出ニューラルネットワークであるMaskBEVを提案する。
MaskBEVは検出されたオブジェクトのフットプリントを表す一連のBEVインスタンスマスクを予測する。
さらに,1回のパスで物体検出と足跡完了を可能にする。
MaskBEVはまた、検出問題を分類の観点から純粋に再構成し、通常はリグレッションによって境界ボックスを予測する。
本研究では,SemanticKITTIとKITTIの両方のデータセット上でのMaskBEVの性能評価を行い,アーキテクチャの利点と限界を分析した。
関連論文リスト
- MonoMAE: Enhancing Monocular 3D Detection through Depth-Aware Masked Autoencoders [93.87585467898252]
Masked Autoencodersにインスパイアされたモノクラー3D検出器MonoMAEを設計する。
MonoMAEは2つの新しい設計で構成されている。第一に、非閉塞オブジェクトクエリの特定の部分を選択的にマスキングするディープ・アウェア・マスクである。
2つ目は軽量なクエリ補完で、ディープ・アウェア・マスキングと連携して、マスキングされたオブジェクトクエリの再構築と完了を学習する。
論文 参考訳(メタデータ) (2024-05-13T12:32:45Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Long Range Object-Level Monocular Depth Estimation for UAVs [0.0]
本稿では,画像からモノクロ物体を長距離検出するための最先端手法の新たな拡張法を提案する。
まず、回帰タスクとして深度推定をモデル化する際、SigmoidおよびReLUライクエンコーディングを提案する。
次に,深度推定を分類問題とし,訓練損失の計算にソフトアルグマックス関数を導入する。
論文 参考訳(メタデータ) (2023-02-17T15:26:04Z) - OA-BEV: Bringing Object Awareness to Bird's-Eye-View Representation for
Multi-Camera 3D Object Detection [78.38062015443195]
OA-BEVは、BEVベースの3Dオブジェクト検出フレームワークにプラグインできるネットワークである。
提案手法は,BEV ベースラインに対する平均精度と nuScenes 検出スコアの両面で一貫した改善を実現する。
論文 参考訳(メタデータ) (2023-01-13T06:02:31Z) - BEV-MAE: Bird's Eye View Masked Autoencoders for Point Cloud
Pre-training in Autonomous Driving Scenarios [51.285561119993105]
自律運転におけるLiDARに基づく3Dオブジェクト検出のための,効率的なマスク付きオートエンコーダ事前学習フレームワークであるBEV-MAEを提案する。
具体的には、3Dエンコーダ学習特徴表現を導くために,鳥の目視(BEV)誘導マスキング戦略を提案する。
学習可能なポイントトークンを導入し、3Dエンコーダの一貫性のある受容的フィールドサイズを維持する。
論文 参考訳(メタデータ) (2022-12-12T08:15:03Z) - BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View
Recognition via Perspective Supervision [101.36648828734646]
本稿では、視線を監督する新しい鳥眼ビュー(BEV)検出器について述べる。
提案手法は,従来および現代の画像バックボーンの幅広いスペクトルを用いて検証し,大規模なnuScenesデータセット上で新たなSoTA結果を得る。
論文 参考訳(メタデータ) (2022-11-18T18:59:48Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - BoxMask: Revisiting Bounding Box Supervision for Video Object Detection [11.255962936937744]
そこで,BoxMaskを提案する。このBoxMaskは,クラス対応の画素レベルの情報を取り入れることで,識別表現を学習する。
提案されたモジュールは、検出を促進するため、任意の領域ベースの検出器に懸命に統合することができる。
論文 参考訳(メタデータ) (2022-10-12T08:25:27Z) - End-to-End Instance Edge Detection [29.650295133113183]
エッジ検出は長い間、コンピュータビジョンの分野で重要な問題であった。
従来の研究は、カテゴリ非依存またはカテゴリ対応エッジ検出を探索してきた。
本稿では,オブジェクトインスタンスのコンテキストにおけるエッジ検出について検討する。
論文 参考訳(メタデータ) (2022-04-06T15:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。