Fugu-MT 論文翻訳(概要): Semantic Instance Segmentation of 3D Scenes Through Weak Bounding Box Supervision

論文の概要: Semantic Instance Segmentation of 3D Scenes Through Weak Bounding Box Supervision

arxiv url: http://arxiv.org/abs/2206.01203v1
Date: Thu, 2 Jun 2022 17:59:57 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-03 14:32:25.549008
Title: Semantic Instance Segmentation of 3D Scenes Through Weak Bounding Box Supervision
Title（参考訳）: 弱境界ボックススーパービジョンによる3次元シーンのセマンティック・インスタンス・セグメンテーション
Authors: Julian Chibane, Francis Engelmann, Tuan Anh Tran, Gerard Pons-Moll
Abstract要約: 弱教師付き3Dインスタンスセマンティックセマンティックセグメンテーションについて検討する。キーとなるアイデアは、3Dバウンディングボックスラベルを活用することだ。弱境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することは可能であることを示す。
参考スコア（独自算出の注目度）: 48.49992874063663
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current 3D segmentation methods heavily rely on large-scale point-cloud datasets, which are notoriously laborious to annotate. Few attempts have been made to circumvent the need for dense per-point annotations. In this work, we look at weakly-supervised 3D instance semantic segmentation. The key idea is to leverage 3D bounding box labels which are easier and faster to annotate. Indeed, we show that it is possible to train dense segmentation models using only weak bounding box labels. At the core of our method, Box2Mask, lies a deep model, inspired by classical Hough voting, that directly votes for bounding box parameters, and a clustering method specifically tailored to bounding box votes. This goes beyond commonly used center votes, which would not fully exploit the bounding box annotations. On ScanNet test, our weakly supervised model attains leading performance among other weakly supervised approaches (+18 mAP50). Remarkably, it also achieves 97% of the performance of fully supervised models. To prove the practicality of our approach, we show segmentation results on the recently released ARKitScenes dataset which is annotated with 3D bounding boxes only, and obtain, for the first time, compelling 3D instance segmentation results.
Abstract（参考訳）: 現在の3Dセグメンテーション手法は、大規模なポイントクラウドデータセットに大きく依存している。ポイント毎の密接なアノテーションの必要性を回避する試みはほとんど行われていない。本稿では,弱教師付き3dインスタンスセマンティクスセグメンテーションについて検討する。キーとなるアイデアは、3Dバウンディングボックスラベルを活用することです。実際,弱境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することは可能である。提案手法の中核であるbox2maskは,従来のハフ投票に触発された,バウンディングボックスパラメータを直接投票する深層モデルと,バウンディングボックス投票に限定したクラスタリング手法である。これは一般的に使われるセンター投票以上のもので、境界ボックスアノテーションを十分に活用しない。 scannetテストでは,弱教師付きモデルが他の弱教師付きアプローチ (+18 map50) において有意な性能を達成している。注目すべきは、完全な教師付きモデルの97%のパフォーマンスを達成することだ。提案手法の実用性を証明するため,最近リリースされたARKitScenesデータセットに3Dバウンディングボックスのみをアノテートしたセグメンテーション結果を示し,初めて説得力のある3Dインスタンスセグメンテーション結果を得る。

関連論文リスト

OpenBox: Annotate Any Bounding Boxes in 3D [26.95078474297576]
3次元オブジェクト検出のための2段階自動アノテーションパイプラインであるOpenBoxを提案する。 OpenBoxはビジョンファウンデーションモデルによって処理された2Dイメージからのインスタンスレベルのキューと、対応する3Dポイントクラウドを関連付ける。インスタンスを剛性と動作状態で分類し、クラス固有のサイズ統計を持つ適応的バウンディングボックスを生成する。
論文参考訳（メタデータ） (2025-12-01T07:04:48Z)
Sketchy Bounding-box Supervision for 3D Instance Segmentation [27.26709842992742]
弱教師付き3DインスタンスセグメンテーションフレームワークであるSketchy-3DISを提案する。まず,2つのスケッチ付きバウンディングボックス間の重なり合う部分に位置する点を適切なインスタンスに割り当てることについて,適応的に学習する。次に、まず、ポイントクラウド全体から粗いインスタンスを予測し、粗いインスタンスの領域に基づいて細かなインスタンスを学習する粗いインスタンスセグメンテータを提示します。
論文参考訳（メタデータ） (2025-05-22T08:49:49Z)
Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文参考訳（メタデータ） (2024-09-12T14:54:31Z)
When 3D Bounding-Box Meets SAM: Point Cloud Instance Segmentation with Weak-and-Noisy Supervision [20.625754683390536]
本稿では,CIP-WPIS法を提案する。 2次元基礎モデルSAMと3次元幾何に埋め込まれた事前学習知識を活用し、正確なポイントワイズ・インスタンス・ラベルを実現する。提案手法は,ノイズの多い3次元境界ボックスアノテーションに対して頑健であり,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-09-02T05:17:03Z)
GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers [14.88505076974645]
GaProは軸方向の3Dバウンディングボックス管理を使用して、3Dポイントクラウドのための新しいインスタンスセグメンテーションである。 2段階のアプローチでは、ボックスアノテーションから擬似ラベルを生成し、3DISネットワークをトレーニングします。実験の結果,GaProは従来の弱教師付き3Dインスタンスセグメンテーション法よりも優れていることがわかった。
論文参考訳（メタデータ） (2023-07-25T04:43:22Z)
You Only Need One Thing One Click: Self-Training for Weakly Supervised 3D Scene Understanding [107.06117227661204]
私たちはOne Thing One Click''を提案する。つまり、アノテーションはオブジェクトごとに1つのポイントをラベル付けするだけです。グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。我々のモデルは、ポイントクラスタリング戦略を備えた3Dインスタンスセグメンテーションと互換性がある。
論文参考訳（メタデータ） (2023-03-26T13:57:00Z)
BoxSnake: Polygonal Instance Segmentation with Box Supervision [34.487089567665556]
ボックスアノテーションのみを用いた効率的な多角形インスタンスセグメンテーションを実現するために,BoxSnakeと呼ばれる新しいエンドツーエンドトレーニング手法を提案する。 BoxSnakeはマスクベースの弱教師付き手法と比較して、予測セグメンテーションとバウンディングボックスの間のパフォーマンスギャップをさらに減らし、Cityscapesデータセットに顕著な優位性を示す。
論文参考訳（メタデータ） (2023-03-21T06:54:18Z)
Weakly Supervised Monocular 3D Object Detection using Multi-View Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文参考訳（メタデータ） (2023-03-15T15:14:00Z)
Collaborative Propagation on Multiple Instance Graphs for 3D Instance Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-08-10T02:14:39Z)
Box2Seg: Learning Semantics of 3D Point Clouds with Box-Level Supervision [65.19589997822155]
我々は3Dポイントクラウドのポイントレベルのセマンティクスをバウンディングボックスレベルの監視で学習するために,Box2Segと呼ばれるニューラルアーキテクチャを導入する。提案するネットワークは,安価な,あるいは既定のバウンディングボックスレベルのアノテーションやサブクラウドレベルのタグでトレーニング可能であることを示す。
論文参考訳（メタデータ） (2022-01-09T09:07:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。