論文の概要: UpCycling: Semi-supervised 3D Object Detection without Sharing Raw-level
Unlabeled Scenes
- arxiv url: http://arxiv.org/abs/2211.11950v1
- Date: Tue, 22 Nov 2022 02:04:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 17:54:17.130904
- Title: UpCycling: Semi-supervised 3D Object Detection without Sharing Raw-level
Unlabeled Scenes
- Title(参考訳): UpCycling: 未ラベルシーンを共有せずに半教師付き3次元物体検出
- Authors: Sunwook Hwang, Youngseok Kim, Seongwon Kim, Saewoong Bahk, Hyung-Sin
Kim
- Abstract要約: UpCyclingは、3Dオブジェクト検出のための新しいSSLフレームワークである。
F-GT(F-GT)と回転(F-RoT)のハイブリッド擬似ラベルを導入する。
UpCyclingは、生のポイントシーンを利用する最先端のSSLメソッドよりも大幅に優れています。
- 参考スコア(独自算出の注目度): 7.32610370107512
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised Learning (SSL) has received increasing attention in
autonomous driving to relieve enormous burden for 3D annotation. In this paper,
we propose UpCycling, a novel SSL framework for 3D object detection with zero
additional raw-level point cloud: learning from unlabeled de-identified
intermediate features (i.e., smashed data) for privacy preservation. The
intermediate features do not require additional computation on autonomous
vehicles since they are naturally produced by the inference pipeline. However,
augmenting 3D scenes at a feature level turns out to be a critical issue:
applying the augmentation methods in the latest semi-supervised 3D object
detectors distorts intermediate features, which causes the pseudo-labels to
suffer from significant noise. To solve the distortion problem while achieving
highly effective SSL, we introduce hybrid pseudo labels, feature-level Ground
Truth sampling (F-GT) and Rotation (F-RoT), which safely augment unlabeled
multi-type 3D scene features and provide high-quality supervision. We implement
UpCycling on two representative 3D object detection models, SECOND-IoU and
PV-RCNN, and perform experiments on widely-used datasets (Waymo, KITTI, and
Lyft). While preserving privacy with zero raw-point scene, UpCycling
significantly outperforms the state-of-the-art SSL methods that utilize
raw-point scenes, in both domain adaptation and partial-label scenarios.
- Abstract(参考訳): 半教師付き学習(SSL)は3Dアノテーションの膨大な負担を軽減するために自動運転に注目が集まっている。
本稿では,プライバシ保護のための非ラベル付き非識別中間機能(すなわちスマッシュデータ)から学習する,新たな3次元オブジェクト検出用SSLフレームワークであるUpCyclingを提案する。
中間機能は、推論パイプラインによって自然に生成されるため、自動運転車で追加の計算を必要としない。
しかし、機能レベルでの3Dシーンの拡大は重要な問題であることが判明した: 最新の半教師付き3Dオブジェクト検出器に拡張手法を適用すると、中間的な特徴が歪み、擬似ラベルが大きなノイズに悩まされる。
sslを高度に有効に利用しながら歪み問題を解決するために,マルチタイプの3dシーン機能を安全に強化し,高品質な監督を提供するハイブリッド擬似ラベル,f-gt(feature-level ground truth sampling)およびf-rot(f-rot)を導入する。
代表的な3Dオブジェクト検出モデルであるSECOND-IoUとPV-RCNNにUpCyclingを実装し、広く使われているデータセット(Waymo、KITTI、Lyft)で実験を行う。
プライバシをゼロの生のポイントシーンで保存する一方で、UpCyclingはドメイン適応と部分ラベルシナリオの両方において、生のポイントシーンを利用する最先端のSSLメソッドよりも大幅に優れています。
関連論文リスト
- Diff3DETR:Agent-based Diffusion Model for Semi-supervised 3D Object Detection [33.58208166717537]
3次元物体検出は3次元シーンの理解に不可欠である。
半教師付き手法の最近の発展は、教師による学習フレームワークを用いて、未ラベルの点群に対する擬似ラベルを生成することにより、この問題を緩和しようとしている。
半教師付き3次元物体検出のためのエージェントベース拡散モデル(Diff3DETR)を提案する。
論文 参考訳(メタデータ) (2024-08-01T05:04:22Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - Zero-Shot Learning on 3D Point Cloud Objects and Beyond [21.6491982908705]
課題のいくつかを特定し,既存のモデルの性能を解析するために3次元領域に2次元ゼロショット学習(ZSL)手法を適用した。
観測された意味論とポイントクラウド機能を同時に調整する新しい損失関数を開発した。
幅広い実験が行われ、合成データセットと実データセットにZSLとGZSLの最先端を確立します。
論文 参考訳(メタデータ) (2021-04-11T10:04:06Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z) - Generative Sparse Detection Networks for 3D Single-shot Object Detection [43.91336826079574]
3Dオブジェクト検出は、ロボット工学や拡張現実など多くの有望な分野に適用可能であるため、広く研究されている。
しかし、3Dデータのまばらな性質は、このタスクに固有の課題をもたらしている。
本稿では,完全畳み込み単一ショットスパース検出ネットワークであるGenerative Sparse Detection Network (GSDN)を提案する。
論文 参考訳(メタデータ) (2020-06-22T15:54:24Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。