論文の概要: Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2303.11243v1
- Date: Mon, 20 Mar 2023 16:28:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 14:30:54.494491
- Title: Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection
- Title(参考訳): Augment and Criticize: Semi-Supervised Monocular 3D Object Detectionのためのインフォームティブサンプル探索
- Authors: Zhenyu Li, Zhipeng Zhang, Heng Fan, Yuan He, Ke Wang, Xianming Liu,
Junjun Jiang
- Abstract要約: 我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
- 参考スコア(独自算出の注目度): 64.65563422852568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we improve the challenging monocular 3D object detection
problem with a general semi-supervised framework. Specifically, having observed
that the bottleneck of this task lies in lacking reliable and informative
samples to train the detector, we introduce a novel, simple, yet effective
`Augment and Criticize' framework that explores abundant informative samples
from unlabeled data for learning more robust detection models. In the `Augment'
stage, we present the Augmentation-based Prediction aGgregation (APG), which
aggregates detections from various automatically learned augmented views to
improve the robustness of pseudo label generation. Since not all pseudo labels
from APG are beneficially informative, the subsequent `Criticize' phase is
presented. In particular, we introduce the Critical Retraining Strategy (CRS)
that, unlike simply filtering pseudo labels using a fixed threshold (e.g.,
classification score) as in 2D semi-supervised tasks, leverages a learnable
network to evaluate the contribution of unlabeled images at different training
timestamps. This way, the noisy samples prohibitive to model evolution could be
effectively suppressed. To validate our framework, we apply it to MonoDLE and
MonoFlex. The two new detectors, dubbed 3DSeMo_DLE and 3DSeMo_FLEX, achieve
state-of-the-art results with remarkable improvements for over 3.5% AP_3D/BEV
(Easy) on KITTI, showing its effectiveness and generality. Code and models will
be released.
- Abstract(参考訳): 本稿では,一般の半教師付きフレームワークを用いて,難解な3次元物体検出問題を改善する。
具体的には、このタスクのボトルネックは、検出器を訓練するための信頼性と情報的サンプルが欠如していることに気付き、より堅牢な検出モデルを学ぶために、ラベルのないデータから豊富な情報的サンプルを探索する、新しくてシンプルで効果的な'Augment and Criticize'フレームワークを導入する。
Augment' の段階では、様々な学習された拡張ビューから検出を集約し、擬似ラベル生成の堅牢性を向上させるAugmentation-based Prediction aGregation (APG) を提案する。
APGからのすべての擬似ラベルが有益な情報であるわけではないので、その後の「批判」フェーズが提示される。
特に,2次元半教師付きタスクのように固定しきい値(例えば分類スコア)を用いて擬似ラベルをフィルタリングすることとは異なり,学習可能なネットワークを利用して異なるトレーニングタイムスタンプでのラベルなし画像の寄与度を評価する,批判的再訓練戦略(crs)を導入する。
これにより、モデル進化を禁止するノイズサンプルを効果的に抑制することができる。
フレームワークを検証するために、MonoDLEとMonoFlexに適用します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善し、その有効性と汎用性を示した。
コードとモデルはリリースされる。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文 参考訳(メタデータ) (2024-07-11T14:58:49Z) - Monocular 3D Object Detection with LiDAR Guided Semi Supervised Active
Learning [2.16117348324501]
LiDAR誘導を用いたモノクロ3次元物体検出のための新しい半教師付き能動学習フレームワーク(SSAL)を提案する。
我々はLiDARを用いて、単分子型3D検出器のデータ選択とトレーニングを、推論フェーズのオーバーヘッドを伴わずにガイドする。
トレーニング戦略は,BEV平均精度(AP)を2.02倍に向上させることで,KITTI 3Dと鳥眼視(BEV)単眼物体検出の公式ベンチマークでトップとなる。
論文 参考訳(メタデータ) (2023-07-17T11:55:27Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。