論文の概要: Box2Mask: Weakly Supervised 3D Semantic Instance Segmentation Using
Bounding Boxes
- arxiv url: http://arxiv.org/abs/2206.01203v3
- Date: Tue, 31 Oct 2023 16:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 04:57:53.551206
- Title: Box2Mask: Weakly Supervised 3D Semantic Instance Segmentation Using
Bounding Boxes
- Title(参考訳): box2mask:バウンディングボックスを用いた3dセマンティックインスタンスセグメンテーション
- Authors: Julian Chibane, Francis Engelmann, Tuan Anh Tran, Gerard Pons-Moll
- Abstract要約: 弱教師付き3Dセマンティックインスタンスセグメンテーションについて検討する。
キーとなるアイデアは、3Dバウンディングボックスラベルを活用することだ。
境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することが可能であることを示す。
- 参考スコア(独自算出の注目度): 38.60444957213202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current 3D segmentation methods heavily rely on large-scale point-cloud
datasets, which are notoriously laborious to annotate. Few attempts have been
made to circumvent the need for dense per-point annotations. In this work, we
look at weakly-supervised 3D semantic instance segmentation. The key idea is to
leverage 3D bounding box labels which are easier and faster to annotate.
Indeed, we show that it is possible to train dense segmentation models using
only bounding box labels. At the core of our method, \name{}, lies a deep
model, inspired by classical Hough voting, that directly votes for bounding box
parameters, and a clustering method specifically tailored to bounding box
votes. This goes beyond commonly used center votes, which would not fully
exploit the bounding box annotations. On ScanNet test, our weakly supervised
model attains leading performance among other weakly supervised approaches (+18
mAP@50). Remarkably, it also achieves 97% of the mAP@50 score of current fully
supervised models. To further illustrate the practicality of our work, we train
Box2Mask on the recently released ARKitScenes dataset which is annotated with
3D bounding boxes only, and show, for the first time, compelling 3D instance
segmentation masks.
- Abstract(参考訳): 現在の3Dセグメンテーション手法は、大規模なポイントクラウドデータセットに大きく依存している。
ポイント毎の密接なアノテーションの必要性を回避する試みはほとんど行われていない。
この研究では、弱い教師付き3dセマンティックインスタンスセグメンテーションについて検討する。
キーとなるアイデアは、3Dバウンディングボックスラベルを活用することです。
実際,境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することは可能である。
この手法の核心である \name{} は、従来のハフ投票に触発された深いモデルであり、バウンディングボックスパラメータを直接投票し、特にバウンディングボックス投票に合わせたクラスタリング手法である。
これは一般的に使われるセンター投票以上のもので、境界ボックスアノテーションを十分に活用しない。
ScanNetテストでは、弱教師付きモデルが、他の弱教師付きアプローチ(+18 mAP@50)の中で主要なパフォーマンスを達成する。
驚くべきことに、現在の完全に監督されたモデルのmap@50の97%も達成している。
作業の実用性をさらに説明するために、最近リリースされたARKitScenesデータセットに3DバウンディングボックスのみをアノテートしたBox2Maskをトレーニングし、説得力のある3Dインスタンスセグメンテーションマスクを初めて示す。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - When 3D Bounding-Box Meets SAM: Point Cloud Instance Segmentation with
Weak-and-Noisy Supervision [20.625754683390536]
本稿では,CIP-WPIS法を提案する。
2次元基礎モデルSAMと3次元幾何に埋め込まれた事前学習知識を活用し、正確なポイントワイズ・インスタンス・ラベルを実現する。
提案手法は,ノイズの多い3次元境界ボックスアノテーションに対して頑健であり,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-02T05:17:03Z) - GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using
Gaussian Processes as Pseudo Labelers [14.88505076974645]
GaProは軸方向の3Dバウンディングボックス管理を使用して、3Dポイントクラウドのための新しいインスタンスセグメンテーションである。
2段階のアプローチでは、ボックスアノテーションから擬似ラベルを生成し、3DISネットワークをトレーニングします。
実験の結果,GaProは従来の弱教師付き3Dインスタンスセグメンテーション法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-07-25T04:43:22Z) - You Only Need One Thing One Click: Self-Training for Weakly Supervised
3D Scene Understanding [107.06117227661204]
私たちはOne Thing One Click''を提案する。つまり、アノテーションはオブジェクトごとに1つのポイントをラベル付けするだけです。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
我々のモデルは、ポイントクラスタリング戦略を備えた3Dインスタンスセグメンテーションと互換性がある。
論文 参考訳(メタデータ) (2023-03-26T13:57:00Z) - BoxSnake: Polygonal Instance Segmentation with Box Supervision [34.487089567665556]
ボックスアノテーションのみを用いた効率的な多角形インスタンスセグメンテーションを実現するために,BoxSnakeと呼ばれる新しいエンドツーエンドトレーニング手法を提案する。
BoxSnakeはマスクベースの弱教師付き手法と比較して、予測セグメンテーションとバウンディングボックスの間のパフォーマンスギャップをさらに減らし、Cityscapesデータセットに顕著な優位性を示す。
論文 参考訳(メタデータ) (2023-03-21T06:54:18Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Box2Seg: Learning Semantics of 3D Point Clouds with Box-Level
Supervision [65.19589997822155]
我々は3Dポイントクラウドのポイントレベルのセマンティクスをバウンディングボックスレベルの監視で学習するために,Box2Segと呼ばれるニューラルアーキテクチャを導入する。
提案するネットワークは,安価な,あるいは既定のバウンディングボックスレベルのアノテーションやサブクラウドレベルのタグでトレーニング可能であることを示す。
論文 参考訳(メタデータ) (2022-01-09T09:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。