論文の概要: Boosting Semi-Supervised 3D Object Detection with Semi-Sampling
- arxiv url: http://arxiv.org/abs/2211.07084v1
- Date: Mon, 14 Nov 2022 03:22:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 18:23:26.015148
- Title: Boosting Semi-Supervised 3D Object Detection with Semi-Sampling
- Title(参考訳): セミサンプリングによる半スーパービジョン3次元物体検出
- Authors: Xiaopei Wu, Yang Zhao, Liang Peng, Hua Chen, Xiaoshui Huang, Binbin
Lin, Haifeng Liu, Deng Cai, Wanli Ouyang
- Abstract要約: 我々は、グラウンド・シークレット・ラベルと擬似ラベルを用いて、ラベル付きフレームとラベルなしフレームのgtサンプルと擬似サンプルを収穫する。
教師が指導する半教師付きフレームワークのトレーニングでは,ラベル付きフレームとラベルなしフレームの両方に対して,gtサンプルと擬似サンプルをランダムに選択する。
我々は、ScanNet、SUN-RGBD、KITTIベンチマークにおける最先端の手法を大きなマージンで継続的に改善する。
- 参考スコア(独自算出の注目度): 85.68737731673396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current 3D object detection methods heavily rely on an enormous amount of
annotations. Semi-supervised learning can be used to alleviate this issue.
Previous semi-supervised 3D object detection methods directly follow the
practice of fully-supervised methods to augment labeled and unlabeled data,
which is sub-optimal. In this paper, we design a data augmentation method for
semi-supervised learning, which we call Semi-Sampling. Specifically, we use
ground truth labels and pseudo labels to crop gt samples and pseudo samples on
labeled frames and unlabeled frames, respectively. Then we can generate a gt
sample database and a pseudo sample database. When training a teacher-student
semi-supervised framework, we randomly select gt samples and pseudo samples to
both labeled frames and unlabeled frames, making a strong data augmentation for
them. Our semi-sampling can be regarded as an extension of gt-sampling to
semi-supervised learning. Our method is simple but effective. We consistently
improve state-of-the-art methods on ScanNet, SUN-RGBD, and KITTI benchmarks by
large margins. For example, when training using only 10% labeled data on
ScanNet, we achieve 3.1 mAP and 6.4 mAP improvement upon 3DIoUMatch in terms of
mAP@0.25 and mAP@0.5. When training using only 1% labeled data on KITTI, we
boost 3DIoUMatch by 3.5 mAP, 6.7 mAP and 14.1 mAP on car, pedestrian and
cyclist classes. Codes will be made publicly available at
https://github.com/LittlePey/Semi-Sampling.
- Abstract(参考訳): 現在の3Dオブジェクト検出方法は大量のアノテーションに大きく依存しています。
半教師付き学習はこの問題を軽減するために使用できる。
従来の半教師付き3Dオブジェクト検出手法は,ラベル付きおよびラベルなしデータを拡張するための完全教師付き手法を直接従う。
本稿では,セミサンプリングと呼ばれる半教師付き学習のためのデータ拡張手法を設計する。
具体的には,グラウンドの真理ラベルと擬似ラベルを用いて,ラベル付きフレーム上のgtサンプルと擬似サンプルを抽出する。
そして、gtサンプルデータベースと擬似サンプルデータベースを生成します。
教師が指導する半教師付きフレームワークを訓練する際、ラベル付きフレームとラベルなしフレームの両方にgtサンプルと擬似サンプルをランダムに選択し、強力なデータ拡張を行う。
セミサンプリングは、gtサンプリングの半教師付き学習への拡張と見なすことができる。
我々の方法は単純だが効果的だ。
我々は、ScanNet、SUN-RGBD、KITTIベンチマークにおける最先端の手法を大きなマージンで継続的に改善する。
例えば、ScanNet上のラベル付きデータのみを使用したトレーニングでは、3DIoUMatchで3.1mAPと6.4mAPの改善をmAP@0.25とmAP@0.5で達成しています。
KITTIのラベル付きデータでトレーニングする場合、車、歩行者、自転車の授業で3DIoUMatchを3.5mAP、6.7mAP、14.1mAPで強化する。
コードはhttps://github.com/LittlePey/Semi-Sampling.comで公開される。
関連論文リスト
- Improving 3D Semi-supervised Learning by Effectively Utilizing All Unlabelled Data [21.015491263215786]
半教師付き学習(SSL)は,少量のラベル付きデータから有効な3次元表現を学習する上での有効性を示した。
SSLベースの新しい3D分類フレームワークであるAllMatchを提案する。
論文 参考訳(メタデータ) (2024-09-21T01:53:52Z) - Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - MixSup: Mixed-grained Supervision for Label-efficient LiDAR-based 3D
Object Detection [59.1417156002086]
MixSupは、大量の安価な粗いラベルと、Mixed-fine Supervisionの限られた数の正確なラベルを同時に活用する、より実用的なパラダイムである。
MixSupは、安価なクラスタアノテーションと10%のボックスアノテーションを使用して、完全な教師付きパフォーマンスの97.31%を達成している。
論文 参考訳(メタデータ) (2024-01-29T17:05:19Z) - ClickSeg: 3D Instance Segmentation with Click-Level Weak Annotations [29.231508413247457]
3次元のインスタンスセグメンテーション法は、トレーニングのために完全に注釈付けされた高密度ラベルを必要とすることが多い。
ClickSegは、クリックレベルの弱教師付き3Dインスタンスセグメンテーション手法である。
ClickSegは、完全に教師された相手の精度の90%の$simを達成している。
論文 参考訳(メタデータ) (2023-07-19T02:49:44Z) - You Only Need One Thing One Click: Self-Training for Weakly Supervised
3D Scene Understanding [107.06117227661204]
私たちはOne Thing One Click''を提案する。つまり、アノテーションはオブジェクトごとに1つのポイントをラベル付けするだけです。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
我々のモデルは、ポイントクラスタリング戦略を備えた3Dインスタンスセグメンテーションと互換性がある。
論文 参考訳(メタデータ) (2023-03-26T13:57:00Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Mix-Teaching: A Simple, Unified and Effective Semi-Supervised Learning
Framework for Monocular 3D Object Detection [22.074959519526605]
Mix-Teachingは、ラベル付き画像とラベルなし画像の両方をトレーニング段階で使用するための効果的な半教師付き学習フレームワークである。
Mix-Teaching は MonoFlex と GUPNet を KITTI データセット上で様々なラベル付け比率で大幅に改善している。
論文 参考訳(メタデータ) (2022-07-10T12:07:25Z) - Humble Teachers Teach Better Students for Semi-Supervised Object
Detection [7.764145630268344]
我々のモデルは、VOC12をラベルなしデータとして使用する場合、VOC07 valセットで53.04%、STACより8.4%のCOCOスタイルのAPを実現する。
また、MS-COCOテストデーブで53.8%APに達し、完全に監督されたResNet-152 Cascaded R-CNNよりも3.1%アップしている。
論文 参考訳(メタデータ) (2021-06-19T09:05:10Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。