論文の概要: BEEP3D: Box-Supervised End-to-End Pseudo-Mask Generation for 3D Instance Segmentation
- arxiv url: http://arxiv.org/abs/2510.12182v1
- Date: Tue, 14 Oct 2025 06:23:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.205882
- Title: BEEP3D: Box-Supervised End-to-End Pseudo-Mask Generation for 3D Instance Segmentation
- Title(参考訳): BEEP3D:3次元インスタンスセグメンテーションのためのBox-Supervised End-to-End Pseudo-Mask Generation
- Authors: Youngju Yoo, Seho Kim, Changick Kim,
- Abstract要約: 3Dインスタンスのセグメンテーションは複雑な3D環境を理解するのに不可欠だが、完全に教師された手法では高濃度のポイントレベルのアノテーションを必要とする。
ボックスレベルのアノテーションは本質的に重複する領域の曖昧さを導入し、正確なポイント・ツー・インスタンスの割り当てを困難にしている。
最近の手法では、追加の訓練段階において、専用の擬似ラベルをトレーニングすることで擬似マスクを生成することで、この曖昧さに対処している。
BEEP3D-Boxによる3次元インスタンスセグメンテーションのためのエンドツーエンド擬似マスク生成を提案する。
- 参考スコア(独自算出の注目度): 28.97274092946373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D instance segmentation is crucial for understanding complex 3D environments, yet fully supervised methods require dense point-level annotations, resulting in substantial annotation costs and labor overhead. To mitigate this, box-level annotations have been explored as a weaker but more scalable form of supervision. However, box annotations inherently introduce ambiguity in overlapping regions, making accurate point-to-instance assignment challenging. Recent methods address this ambiguity by generating pseudo-masks through training a dedicated pseudo-labeler in an additional training stage. However, such two-stage pipelines often increase overall training time and complexity, hinder end-to-end optimization. To overcome these challenges, we propose BEEP3D-Box-supervised End-to-End Pseudo-mask generation for 3D instance segmentation. BEEP3D adopts a student-teacher framework, where the teacher model serves as a pseudo-labeler and is updated by the student model via an Exponential Moving Average. To better guide the teacher model to generate precise pseudo-masks, we introduce an instance center-based query refinement that enhances position query localization and leverages features near instance centers. Additionally, we design two novel losses-query consistency loss and masked feature consistency loss-to align semantic and geometric signals between predictions and pseudo-masks. Extensive experiments on ScanNetV2 and S3DIS datasets demonstrate that BEEP3D achieves competitive or superior performance compared to state-of-the-art weakly supervised methods while remaining computationally efficient.
- Abstract(参考訳): 3Dインスタンスのセグメンテーションは複雑な3D環境を理解するのに不可欠だが、完全に教師された手法では高密度なポイントレベルのアノテーションを必要とする。
これを軽減するため、ボックスレベルのアノテーションはより弱いがよりスケーラブルな監視形態として検討されてきた。
しかし、ボックスアノテーションは本質的に重複する領域に曖昧さを導入し、正確なポイントツーインスタンス割り当てを困難にしている。
最近の手法では、追加の訓練段階において、専用の擬似ラベルをトレーニングすることで擬似マスクを生成することで、この曖昧さに対処している。
しかしながら、このような2段階のパイプラインは、全体的なトレーニング時間と複雑さを増大させ、エンドツーエンドの最適化を妨げることが多い。
これらの課題を克服するために,BEEP3D-Boxによる3次元インスタンス分割のためのエンドツーエンド擬似マスク生成を提案する。
BEEP3Dは、教師モデルが擬似ラベルとして機能し、指数移動平均を通じて生徒モデルによって更新される学生教師フレームワークを採用している。
教師モデルから正確な擬似マスクを生成するための指針として、位置クエリのローカライゼーションを強化し、インスタンスセンタ近傍の機能を活用するインスタンスセンタベースのクエリリファインメントを導入する。
さらに、予測と擬似マスク間の意味的および幾何学的信号の整合性を確保するために、2つの新しい損失クエリ整合損失とマスク付き特徴整合損失を設計する。
ScanNetV2とS3DISデータセットの大規模な実験は、BEEP3Dが計算効率を保ちながら最先端の弱い教師付き手法と比較して、競争力や優れた性能を達成することを示した。
関連論文リスト
- SGS-3D: High-Fidelity 3D Instance Segmentation via Reliable Semantic Mask Splitting and Growing [20.383892902000976]
高忠実度3Dインスタンスセグメンテーション(SGS-3D)のための分割・成長型セマンティックマスクを提案する。
本稿では,3次元幾何学的プリミティブの共起を利用したマスクフィルタリング手法を提案する。
幾何学的洗練のために,空間的連続性と高次特徴を両立させて細粒度オブジェクトインスタンスを構築する。
論文 参考訳(メタデータ) (2025-09-05T14:37:31Z) - SP3D: Boosting Sparsely-Supervised 3D Object Detection via Accurate Cross-Modal Semantic Prompts [13.349110509879312]
スパース制御された3Dオブジェクト検出は注目され、完全に教師された3Dオブジェクト・オブジェクタに近い性能を実現している。
本研究では,スパースアノテーション設定下での頑健な特徴識別機能を備えた3D検出器の強化を目的とした,SP3Dと呼ばれるブースティング戦略を提案する。
実験により、SP3Dはわずかに観察された検出器の性能を、平均的なラベル付け条件下で大きなマージンで向上させることができることが確認された。
論文 参考訳(メタデータ) (2025-03-09T06:08:04Z) - Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z) - AutoInst: Automatic Instance-Based Segmentation of LiDAR 3D Scans [41.17467024268349]
3D環境を理解するには、きめ細かい風景を理解する必要がある。
教師なしの方法で3次元シーンのインスタンスセグメンテーションを予測することを提案する。
平均精度は13.3%,F1スコアは9.1%向上した。
論文 参考訳(メタデータ) (2024-03-24T22:53:16Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。