論文の概要: Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2304.01464v1
- Date: Tue, 4 Apr 2023 02:09:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 15:42:07.118403
- Title: Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection
- Title(参考訳): 3次元半監督物体検出のための階層的スーパービジョンとシャッフルデータ拡張
- Authors: Chuandong Liu, Chenqiang Gao, Fangcen Liu, Pengcheng Li, Deyu Meng,
Xinbo Gao
- Abstract要約: 最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
- 参考スコア(独自算出の注目度): 90.32180043449263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art 3D object detectors are usually trained on large-scale
datasets with high-quality 3D annotations. However, such 3D annotations are
often expensive and time-consuming, which may not be practical for real
applications. A natural remedy is to adopt semi-supervised learning (SSL) by
leveraging a limited amount of labeled samples and abundant unlabeled samples.
Current pseudolabeling-based SSL object detection methods mainly adopt a
teacher-student framework, with a single fixed threshold strategy to generate
supervision signals, which inevitably brings confused supervision when guiding
the student network training. Besides, the data augmentation of the point cloud
in the typical teacher-student framework is too weak, and only contains basic
down sampling and flip-and-shift (i.e., rotate and scaling), which hinders the
effective learning of feature information. Hence, we address these issues by
introducing a novel approach of Hierarchical Supervision and Shuffle Data
Augmentation (HSSDA), which is a simple yet effective teacher-student
framework. The teacher network generates more reasonable supervision for the
student network by designing a dynamic dual-threshold strategy. Besides, the
shuffle data augmentation strategy is designed to strengthen the feature
representation ability of the student network. Extensive experiments show that
HSSDA consistently outperforms the recent state-of-the-art methods on different
datasets. The code will be released at https://github.com/azhuantou/HSSDA.
- Abstract(参考訳): 最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
しかし、こうした3dアノテーションは、しばしば高価で時間がかかり、実際のアプリケーションでは実用的ではないかもしれない。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
現在の擬似ラベリングに基づくSSLオブジェクト検出手法は、主に教師が学習するフレームワークを採用しており、学生ネットワークトレーニングを指導する際、必然的に混乱する監視信号を生成するための単一の固定しきい値戦略を採用している。
さらに、典型的な教師/学生フレームワークにおけるポイントクラウドのデータ増大は弱く、基本的なダウンサンプリングとフリップ・アンド・シフト(すなわち回転とスケーリング)しか含んでおらず、特徴情報の効果的な学習を妨げる。
そこで本稿では,教師教育の枠組みである階層的監督とシャッフルデータ拡張(hssda)の新たなアプローチを導入することで,これらの課題に対処した。
教師ネットワークは、動的二重閾値戦略を設計することにより、学生ネットワークをより合理的に管理する。
さらに、shuffleデータ拡張戦略は、学生ネットワークの特徴表現能力を強化するために設計されている。
大規模な実験により、HSSDAはさまざまなデータセットで最新の最先端の手法より一貫して優れていることが示されている。
コードはhttps://github.com/azhuantou/hsdaでリリースされる。
関連論文リスト
- Self-supervised cross-modality learning for uncertainty-aware object detection and recognition in applications which lack pre-labelled training data [6.892494758401737]
我々は、不確実性を認識したディープニューラルネットワークが2次元RGB画像中の物体を検出し、認識し、ローカライズするためにどのように訓練されるかを示す。
本手法は,ラベル付きデータセットが一般に利用できない,多くの重要な産業タスクに適用可能である。
論文 参考訳(メタデータ) (2024-11-05T13:26:31Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Large-Scale Pre-training for Person Re-identification with Noisy Labels [125.49696935852634]
雑音ラベル(PNL)を利用した大規模事前学習フレームワークを開発した。
原則として、これらの3つのモジュールの合同学習は、1つのプロトタイプに類似したクラスタの例だけでなく、プロトタイプの割り当てに基づいてノイズラベルを修正します。
このシンプルな事前学習タスクは、ベルやwhiを使わずに"LUPerson-NL"でSOTA Re-ID表現をスクラッチから学習するスケーラブルな方法を提供する。
論文 参考訳(メタデータ) (2022-03-30T17:59:58Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。