論文の概要: Seg2Box: 3D Object Detection by Point-Wise Semantics Supervision
- arxiv url: http://arxiv.org/abs/2503.16811v1
- Date: Fri, 21 Mar 2025 02:39:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:56:58.269645
- Title: Seg2Box: 3D Object Detection by Point-Wise Semantics Supervision
- Title(参考訳): Seg2Box:Point-Wise Semantics Supervisionによる3Dオブジェクト検出
- Authors: Maoji Zheng, Ziyu Xu, Qiming Xia, Hai Wu, Chenglu Wen, Cheng Wang,
- Abstract要約: LiDARに基づく3Dオブジェクト検出とセマンティックセグメンテーションは、3Dシーン理解において重要なタスクである。
従来の検出と方法は、バウンディングボックスラベルとセマンティックマスクラベルを通じてモデルを監督する。
本稿では,意味ラベルのみを用いた3次元物体検出を監督することにより,冗長性を解消することを目的とする。
- 参考スコア(独自算出の注目度): 15.996707255179668
- License:
- Abstract: LiDAR-based 3D object detection and semantic segmentation are critical tasks in 3D scene understanding. Traditional detection and segmentation methods supervise their models through bounding box labels and semantic mask labels. However, these two independent labels inherently contain significant redundancy. This paper aims to eliminate the redundancy by supervising 3D object detection using only semantic labels. However, the challenge arises due to the incomplete geometry structure and boundary ambiguity of point-cloud instances, leading to inaccurate pseudo labels and poor detection results. To address these challenges, we propose a novel method, named Seg2Box. We first introduce a Multi-Frame Multi-Scale Clustering (MFMS-C) module, which leverages the spatio-temporal consistency of point clouds to generate accurate box-level pseudo-labels. Additionally, the Semantic?Guiding Iterative-Mining Self-Training (SGIM-ST) module is proposed to enhance the performance by progressively refining the pseudo-labels and mining the instances without generating pseudo-labels. Experiments on the Waymo Open Dataset and nuScenes Dataset show that our method significantly outperforms other competitive methods by 23.7\% and 10.3\% in mAP, respectively. The results demonstrate the great label-efficient potential and advancement of our method.
- Abstract(参考訳): LiDARに基づく3Dオブジェクト検出とセマンティックセグメンテーションは、3Dシーン理解において重要なタスクである。
従来の検出とセグメンテーション方法は、バウンディングボックスラベルとセマンティックマスクラベルを通じてモデルを監督する。
しかし、これらの2つの独立ラベルは本質的に重要な冗長性を含んでいる。
本稿では,意味ラベルのみを用いた3次元物体検出を監督することにより,冗長性を解消することを目的とする。
しかし、この課題は、不完全な幾何学構造とポイントクラウドインスタンスの境界曖昧さによって発生し、不正確な擬似ラベルと検出結果の低さにつながる。
これらの課題に対処するため,Seg2Boxという新しい手法を提案する。
まず,マルチフレーム・マルチスケールクラスタリング(MFMS-C)モジュールを導入し,点雲の時空間的一貫性を利用して正確なボックスレベルの擬似ラベルを生成する。
さらに、セマンティック?
擬似ラベルを徐々に精錬し、擬似ラベルを生成せずにインスタンスをマイニングすることで性能を向上させるため、反復マイニング(SGIM-ST)モジュールの誘導を提案する。
Waymo Open Dataset と nuScenes Dataset の実験により、我々の手法は、mAP において、それぞれ 23.7\% と 10.3\% の競合手法を著しく上回っていることが示された。
その結果,提案手法のラベル有効性および進歩が示された。
関連論文リスト
- SAM-guided Pseudo Label Enhancement for Multi-modal 3D Semantic Segmentation [16.019735682706163]
自律運転や仮想現実(VR)などの応用には多モード3Dセマンティックセマンティックセマンティックセマンティクスが不可欠である
これらのモデルを現実のシナリオに効果的にデプロイするには、クロスドメイン適応技術を採用することが不可欠である。
擬似ラベルを用いた自己学習が3次元セマンティックセグメンテーションにおけるクロスドメイン適応の主要な手法として浮上している。
論文 参考訳(メタデータ) (2025-02-02T23:52:37Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Box2Seg: Learning Semantics of 3D Point Clouds with Box-Level
Supervision [65.19589997822155]
我々は3Dポイントクラウドのポイントレベルのセマンティクスをバウンディングボックスレベルの監視で学習するために,Box2Segと呼ばれるニューラルアーキテクチャを導入する。
提案するネットワークは,安価な,あるいは既定のバウンディングボックスレベルのアノテーションやサブクラウドレベルのタグでトレーニング可能であることを示す。
論文 参考訳(メタデータ) (2022-01-09T09:07:48Z) - Dense Supervision Propagation for Weakly Supervised Semantic Segmentation on 3D Point Clouds [59.63231842439687]
意味点クラウドセグメンテーションネットワークをトレーニングする。
同様の特徴を伝達し、2つのサンプルにまたがる勾配を再現するクロスサンプル機能再配置モジュールを提案する。
ラベルの10%と1%しか持たない弱教師付き手法では、完全教師付き手法と互換性のある結果が得られる。
論文 参考訳(メタデータ) (2021-07-23T14:34:57Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。