論文の概要: Semantic Instance Segmentation of 3D Scenes Through Weak Bounding Box
Supervision
- arxiv url: http://arxiv.org/abs/2206.01203v1
- Date: Thu, 2 Jun 2022 17:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 14:32:25.549008
- Title: Semantic Instance Segmentation of 3D Scenes Through Weak Bounding Box
Supervision
- Title(参考訳): 弱境界ボックススーパービジョンによる3次元シーンのセマンティック・インスタンス・セグメンテーション
- Authors: Julian Chibane, Francis Engelmann, Tuan Anh Tran, Gerard Pons-Moll
- Abstract要約: 弱教師付き3Dインスタンスセマンティックセマンティックセグメンテーションについて検討する。
キーとなるアイデアは、3Dバウンディングボックスラベルを活用することだ。
弱境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することは可能であることを示す。
- 参考スコア(独自算出の注目度): 48.49992874063663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current 3D segmentation methods heavily rely on large-scale point-cloud
datasets, which are notoriously laborious to annotate. Few attempts have been
made to circumvent the need for dense per-point annotations. In this work, we
look at weakly-supervised 3D instance semantic segmentation. The key idea is to
leverage 3D bounding box labels which are easier and faster to annotate.
Indeed, we show that it is possible to train dense segmentation models using
only weak bounding box labels. At the core of our method, Box2Mask, lies a deep
model, inspired by classical Hough voting, that directly votes for bounding box
parameters, and a clustering method specifically tailored to bounding box
votes. This goes beyond commonly used center votes, which would not fully
exploit the bounding box annotations. On ScanNet test, our weakly supervised
model attains leading performance among other weakly supervised approaches (+18
mAP50). Remarkably, it also achieves 97% of the performance of fully supervised
models. To prove the practicality of our approach, we show segmentation results
on the recently released ARKitScenes dataset which is annotated with 3D
bounding boxes only, and obtain, for the first time, compelling 3D instance
segmentation results.
- Abstract(参考訳): 現在の3Dセグメンテーション手法は、大規模なポイントクラウドデータセットに大きく依存している。
ポイント毎の密接なアノテーションの必要性を回避する試みはほとんど行われていない。
本稿では,弱教師付き3dインスタンスセマンティクスセグメンテーションについて検討する。
キーとなるアイデアは、3Dバウンディングボックスラベルを活用することです。
実際,弱境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することは可能である。
提案手法の中核であるbox2maskは,従来のハフ投票に触発された,バウンディングボックスパラメータを直接投票する深層モデルと,バウンディングボックス投票に限定したクラスタリング手法である。
これは一般的に使われるセンター投票以上のもので、境界ボックスアノテーションを十分に活用しない。
scannetテストでは,弱教師付きモデルが他の弱教師付きアプローチ (+18 map50) において有意な性能を達成している。
注目すべきは、完全な教師付きモデルの97%のパフォーマンスを達成することだ。
提案手法の実用性を証明するため,最近リリースされたARKitScenesデータセットに3Dバウンディングボックスのみをアノテートしたセグメンテーション結果を示し,初めて説得力のある3Dインスタンスセグメンテーション結果を得る。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - When 3D Bounding-Box Meets SAM: Point Cloud Instance Segmentation with
Weak-and-Noisy Supervision [20.625754683390536]
本稿では,CIP-WPIS法を提案する。
2次元基礎モデルSAMと3次元幾何に埋め込まれた事前学習知識を活用し、正確なポイントワイズ・インスタンス・ラベルを実現する。
提案手法は,ノイズの多い3次元境界ボックスアノテーションに対して頑健であり,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-02T05:17:03Z) - GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using
Gaussian Processes as Pseudo Labelers [14.88505076974645]
GaProは軸方向の3Dバウンディングボックス管理を使用して、3Dポイントクラウドのための新しいインスタンスセグメンテーションである。
2段階のアプローチでは、ボックスアノテーションから擬似ラベルを生成し、3DISネットワークをトレーニングします。
実験の結果,GaProは従来の弱教師付き3Dインスタンスセグメンテーション法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-07-25T04:43:22Z) - You Only Need One Thing One Click: Self-Training for Weakly Supervised
3D Scene Understanding [107.06117227661204]
私たちはOne Thing One Click''を提案する。つまり、アノテーションはオブジェクトごとに1つのポイントをラベル付けするだけです。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
我々のモデルは、ポイントクラスタリング戦略を備えた3Dインスタンスセグメンテーションと互換性がある。
論文 参考訳(メタデータ) (2023-03-26T13:57:00Z) - BoxSnake: Polygonal Instance Segmentation with Box Supervision [34.487089567665556]
ボックスアノテーションのみを用いた効率的な多角形インスタンスセグメンテーションを実現するために,BoxSnakeと呼ばれる新しいエンドツーエンドトレーニング手法を提案する。
BoxSnakeはマスクベースの弱教師付き手法と比較して、予測セグメンテーションとバウンディングボックスの間のパフォーマンスギャップをさらに減らし、Cityscapesデータセットに顕著な優位性を示す。
論文 参考訳(メタデータ) (2023-03-21T06:54:18Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Box2Seg: Learning Semantics of 3D Point Clouds with Box-Level
Supervision [65.19589997822155]
我々は3Dポイントクラウドのポイントレベルのセマンティクスをバウンディングボックスレベルの監視で学習するために,Box2Segと呼ばれるニューラルアーキテクチャを導入する。
提案するネットワークは,安価な,あるいは既定のバウンディングボックスレベルのアノテーションやサブクラウドレベルのタグでトレーニング可能であることを示す。
論文 参考訳(メタデータ) (2022-01-09T09:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。