論文の概要: Rethinking the Encoding and Annotating of 3D Bounding Box: Corner-Aware 3D Object Detection from Point Clouds
- arxiv url: http://arxiv.org/abs/2511.17619v1
- Date: Tue, 18 Nov 2025 13:49:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.298765
- Title: Rethinking the Encoding and Annotating of 3D Bounding Box: Corner-Aware 3D Object Detection from Point Clouds
- Title(参考訳): 3Dバウンディングボックスの符号化とアノテーション再考:点雲からの3D物体検出をコーナーが認識する
- Authors: Qinghao Meng, Junbo Yin, Jianbing Shen, Yunde Jia,
- Abstract要約: 中心方向の回帰はLiDARベースの3Dオブジェクト検出において依然として支配的だが、基本的な不安定さに悩まされている。
本稿では,予測対象を不安定な中心から幾何学的情報的コーナーへシフトするコーナーアライン回帰を提案する。
我々は、既存の検出器に差し込むことができる、シンプルで効果的なコーナー認識検出ヘッドを設計する。
- 参考スコア(独自算出の注目度): 69.84768614060559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Center-aligned regression remains dominant in LiDAR-based 3D object detection, yet it suffers from fundamental instability: object centers often fall in sparse or empty regions of the bird's-eye-view (BEV) due to the front-surface-biased nature of LiDAR point clouds, leading to noisy and inaccurate bounding box predictions. To circumvent this limitation, we revisit bounding box representation and propose corner-aligned regression, which shifts the prediction target from unstable centers to geometrically informative corners that reside in dense, observable regions. Leveraging the inherent geometric constraints among corners and image 2D boxes, partial parameters of 3D bounding boxes can be recovered from corner annotations, enabling a weakly supervised paradigm without requiring complete 3D labels. We design a simple yet effective corner-aware detection head that can be plugged into existing detectors. Experiments on KITTI show our method improves performance by 3.5% AP over center-based baseline, and achieves 83% of fully supervised accuracy using only BEV corner clicks, demonstrating the effectiveness of our corner-aware regression strategy.
- Abstract(参考訳): 中心に沿った回帰は、LiDARベースの3Dオブジェクト検出において支配的であるが、基本的な不安定さに悩まされている。
この制限を回避するため、我々は境界ボックス表現を再検討し、予測対象を不安定な中心から、密集した観測可能な領域にある幾何学的情報的コーナーへシフトさせるコーナー整列回帰を提案する。
コーナーとイメージ2Dボックス間の固有の幾何学的制約を利用することで、3D境界ボックスの部分パラメータをコーナーアノテーションから復元することができ、完全な3Dラベルを必要とせずに、弱教師付きパラダイムを実現することができる。
我々は、既存の検出器に差し込むことができる、シンプルで効果的なコーナー認識検出ヘッドを設計する。
KITTIの実験では,中心ベースラインよりもAPが3.5%向上し,BEVコーナークリックのみを用いて全監督精度の83%を達成し,コーナー認識回帰戦略の有効性を示した。
関連論文リスト
- SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection [49.12928389918159]
既存の単分子3D検出器は典型的には、切り離された予測パラダイムを通じて、3D境界ボックスの顕著な非線形回帰をテームする。
本稿では2つの主成分を持つ新しい空間射影アライメント(SPAN)を提案する。
SPANは、予測された3次元境界ボックスと接地した3次元境界ボックスの間に明らかに大域的な空間的制約を課し、それによって非結合な特性回帰による空間的ドリフトを補正する。
3D-2Dプロジェクションアライメントは、投影された3Dボックスが、画像平面上の対応する2D検出バウンディングボックス内に密に整列していることを保証する。
論文 参考訳(メタデータ) (2025-11-10T04:48:48Z) - RQR3D: Reparametrizing the regression targets for BEV-based 3D object detection [0.4604003661048266]
Bird's-eye view (BEV)ベースの知覚アプローチは、パースペクティブベースのソリューションの優れた代替手段として現れている。
本稿では,3次元回帰目標を定義するために,制限付き四辺形表現を提案する。
RQR3Dは、2つのボックスの隅の間にあるオフセットとともに、指向するボックスをカプセル化する最小の水平境界ボックスを回帰する。
論文 参考訳(メタデータ) (2025-05-23T10:52:34Z) - CornerPoint3D: Look at the Nearest Corner Instead of the Center [7.293031759018836]
3Dオブジェクト検出は、LiDAR点雲から物体の中心、寸法、回転を予測することを目的としている。
LiDARはオブジェクトの近辺のみを捕捉し、センターベースの検出器はクロスドメインタスクのローカライズ精度が低い。
本研究では、CenterPoint上に構築され、ヒートマップを用いて各物体の最も近い角の学習と検出を監督する新しい3Dオブジェクト検出器CornerPoint3Dを提案する。
論文 参考訳(メタデータ) (2025-04-03T10:33:43Z) - OriCon3D: Effective 3D Object Detection using Orientation and Confidence [0.0]
1つの画像から3次元物体を検出するための高度な手法を提案する。
我々は、深層畳み込みニューラルネットワークに基づく3Dオブジェクト重み付け指向回帰パラダイムを用いる。
提案手法は, 3次元オブジェクトのポーズ決定の精度を大幅に向上し, ベースライン法を超越した。
論文 参考訳(メタデータ) (2023-04-27T19:52:47Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - CG-SSD: Corner Guided Single Stage 3D Object Detection from LiDAR Point
Cloud [4.110053032708927]
現実世界では、LiDARは限られた物体の表面点の雲しか取得できないが、物体の中心点は存在しない。
コーナー誘導型アンカーフリー単段3次元物体検出モデル(CG-SSD)を提案する。
CG-SSDは、単一フレームポイントクラウドデータを用いた教師付き3Dオブジェクト検出のためのONCEベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-02-24T02:30:15Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR
Segmentation [81.02742110604161]
大規模運転シーンのLiDARセグメンテーションのための最先端の手法は、しばしば点雲を2次元空間に投影し、2D畳み込みによって処理する。
そこで我々は,3次元幾何学的パタンを探索するために,円筒分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
提案手法はセマンティックKITTIのリーダーボードにおいて第1位を獲得し,既存のnuScenesの手法を約4%のマージンで上回っている。
論文 参考訳(メタデータ) (2020-11-19T18:53:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。