論文の概要: Self-Supervised 3D Monocular Object Detection by Recycling Bounding
Boxes
- arxiv url: http://arxiv.org/abs/2206.12738v1
- Date: Sat, 25 Jun 2022 21:48:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-03 02:14:56.913645
- Title: Self-Supervised 3D Monocular Object Detection by Recycling Bounding
Boxes
- Title(参考訳): リサイクルバウンディングボックスによる自己監督型3次元物体検出
- Authors: Sugirtha T, Sridevi M, Khailash Santhakumar, Hao Liu, B Ravi Kiran,
Thomas Gauthier, Senthil Yogamani
- Abstract要約: 本稿では, ランダムウィンドウをプレテキストタスクとしてラベル付けすることで, 自己教師付きバウンディングボックスリサイクルの確立について検討する。
また,mAP 3Dでは2~3%,BEVでは0.9~1.5%,SSLではベースラインスコアでは0.9~1.5%の改善が見られた。
- 参考スコア(独自算出の注目度): 3.3299316770988625
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern object detection architectures are moving towards employing
self-supervised learning (SSL) to improve performance detection with related
pretext tasks. Pretext tasks for monocular 3D object detection have not yet
been explored yet in literature. The paper studies the application of
established self-supervised bounding box recycling by labeling random windows
as the pretext task. The classifier head of the 3D detector is trained to
classify random windows containing different proportions of the ground truth
objects, thus handling the foreground-background imbalance. We evaluate the
pretext task using the RTM3D detection model as baseline, with and without the
application of data augmentation. We demonstrate improvements of between 2-3 %
in mAP 3D and 0.9-1.5 % BEV scores using SSL over the baseline scores. We
propose the inverse class frequency re-weighted (ICFW) mAP score that
highlights improvements in detection for low frequency classes in a class
imbalanced dataset with long tails. We demonstrate improvements in ICFW both
mAP 3D and BEV scores to take into account the class imbalance in the KITTI
validation dataset. We see 4-5 % increase in ICFW metric with the pretext task.
- Abstract(参考訳): 現代のオブジェクト検出アーキテクチャは、関連するプリテキストタスクによるパフォーマンス検出を改善するために、自己教師付き学習(SSL)の採用に向かっている。
モノクロ3dオブジェクト検出のためのプリテキストタスクはまだ文献で検討されていない。
本稿では, ランダムウィンドウをプレテキストタスクとしてラベル付けすることで, 自己教師付きバウンディングボックスリサイクルの適用について検討する。
3D検出器の分類器ヘッドは、基底真理対象の異なる割合のランダムウィンドウを分類するように訓練され、フォアグラウンドとバックグラウンドの不均衡を処理する。
RTM3D検出モデルをベースラインとして,データ拡張の適用の有無に関わらず,プリテキストタスクを評価する。
また,mAP 3Dでは2~3%,BEVでは0.9~1.5%の改善率を示した。
長い尾を持つクラス不均衡データセットにおける低周波クラスの検出精度の向上を強調した逆クラス周波数再重み付け(ICFW)mAPスコアを提案する。
KITTI検証データセットのクラス不均衡を考慮したICFWにおけるmAP 3DとBEVスコアの改善を示す。
プレテキストタスクでは、ICFWメトリックが4~5%増加しています。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Delving into the Pre-training Paradigm of Monocular 3D Object Detection [10.07932482761621]
単分子3次元物体検出(M3OD)のための事前学習パラダイムについて検討する。
本稿では,このベースラインをさらに改善するためのいくつかの戦略を提案する。主に,目標とする半深度推定,キーポイント認識2Dオブジェクト検出,クラスレベルの損失調整などである。
開発したすべての技術を組み合わせることで、得られた事前学習フレームワークは、KITTI-3DおよびnuScenesベンチマーク上でM3OD性能を大幅に向上させる事前学習されたバックボーンを生成する。
論文 参考訳(メタデータ) (2022-06-08T03:01:13Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - Exploring 2D Data Augmentation for 3D Monocular Object Detection [0.2936007114555107]
多くの標準的な2Dオブジェクト検出データ拡張技術は3Dボックスに拡張されない。
本研究では, 新規な視点合成を必要とせず, 単眼3次元検出のための2つの新しい増強法を提案する。
論文 参考訳(メタデータ) (2021-04-21T22:43:42Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。