論文の概要: Fully Test-Time Adaptation for Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2405.19682v1
- Date: Thu, 30 May 2024 04:37:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-31 18:06:52.674181
- Title: Fully Test-Time Adaptation for Monocular 3D Object Detection
- Title(参考訳): 単眼3次元物体検出のための完全テスト時間適応法
- Authors: Hongbin Lin, Yifan Zhang, Shuaicheng Niu, Shuguang Cui, Zhen Li,
- Abstract要約: モノクロ3Dオブジェクト検出(Mono 3Det)は、単一のRGB画像から3Dオブジェクトを識別することを目的としている。
既存の手法では、トレーニングとテストデータが同じ分布に従っていると仮定することが多いが、実際のテストシナリオでは適用できないことがある。
フルテストタイム適応(Fully Test-time Adaptation)と呼ばれるMono 3Detの新しい適応パラダイムについて検討する。
トレーニングデータやテストラベルにアクセスせずに、テスト時に潜在的なデータ分散シフトを処理して、ラベルのないテストデータに十分にトレーニングされたモデルを適用することを目指している。
- 参考スコア(独自算出の注目度): 43.208715152204995
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Monocular 3D object detection (Mono 3Det) aims to identify 3D objects from a single RGB image. However, existing methods often assume training and test data follow the same distribution, which may not hold in real-world test scenarios. To address the out-of-distribution (OOD) problems, we explore a new adaptation paradigm for Mono 3Det, termed Fully Test-time Adaptation. It aims to adapt a well-trained model to unlabeled test data by handling potential data distribution shifts at test time without access to training data and test labels. However, applying this paradigm in Mono 3Det poses significant challenges due to OOD test data causing a remarkable decline in object detection scores. This decline conflicts with the pre-defined score thresholds of existing detection methods, leading to severe object omissions (i.e., rare positive detections and many false negatives). Consequently, the limited positive detection and plenty of noisy predictions cause test-time adaptation to fail in Mono 3Det. To handle this problem, we propose a novel Monocular Test-Time Adaptation (MonoTTA) method, based on two new strategies. 1) Reliability-driven adaptation: we empirically find that high-score objects are still reliable and the optimization of high-score objects can enhance confidence across all detections. Thus, we devise a self-adaptive strategy to identify reliable objects for model adaptation, which discovers potential objects and alleviates omissions. 2) Noise-guard adaptation: since high-score objects may be scarce, we develop a negative regularization term to exploit the numerous low-score objects via negative learning, preventing overfitting to noise and trivial solutions. Experimental results show that MonoTTA brings significant performance gains for Mono 3Det models in OOD test scenarios, approximately 190% gains by average on KITTI and 198% gains on nuScenes.
- Abstract(参考訳): モノクロ3Dオブジェクト検出(Mono 3Det)は、単一のRGB画像から3Dオブジェクトを識別することを目的としている。
しかし、既存の手法では、トレーニングとテストデータは、実際のテストシナリオでは適用できないような、同じ分布に従っていると仮定することが多い。
アウト・オブ・ディストリビューション(OOD)問題に対処するため、Mono 3Detの新しい適応パラダイムを探求する。
トレーニングデータやテストラベルにアクセスせずに、テスト時に潜在的なデータ分散シフトを処理して、ラベルのないテストデータに十分にトレーニングされたモデルを適用することを目指している。
しかし、Mono 3Detにこのパラダイムを適用すると、OODテストデータがオブジェクト検出スコアを著しく低下させるため、大きな課題が生じる。
この減少は、既存の検出方法の既定スコア閾値と矛盾し、重い物体の欠落(まれな正の検出と多くの偽陰性)を引き起こす。
その結果、限定された肯定的な検出と多くのノイズ予測が、Mono 3Detでテスト時の適応に失敗する。
この問題に対処するために,2つの新しい戦略に基づいたモノクロテスト時間適応法を提案する。
1) 信頼性駆動型適応: ハイスコアオブジェクトは信頼性が保たれており, ハイスコアオブジェクトの最適化により全検出における信頼性が向上する。
そこで我々は、モデル適応のための信頼性のあるオブジェクトを同定し、潜在的なオブジェクトを発見し、省略を緩和する自己適応戦略を考案した。
2)ノイズガード適応:高音域の物体は少ないため、負の学習によって多数の低音域の物体を悪用し、ノイズや自明な解への過度な適合を防ぎ、負の正則化項を開発する。
実験の結果、MonoTTAはOODテストシナリオでMono 3Detモデルに大幅なパフォーマンス向上をもたらし、KITTIでは平均で約190%、nuSceneでは198%向上した。
関連論文リスト
- False Positive Sampling-based Data Augmentation for Enhanced 3D Object Detection Accuracy [2.3196786369361977]
限られた地中構造データによってもたらされる課題に対処するための拡張手法として,地中構造サンプリングが提案されている。
本研究は, 偽陽性サンプリングと呼ばれる新しい拡張手法を開発することにより, 地中構造サンプリングの限界を克服し, 3次元物体検出モデルの性能を向上させることを目的とする。
論文 参考訳(メタデータ) (2024-03-05T04:07:54Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。
また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文 参考訳(メタデータ) (2022-04-06T06:39:40Z) - MEMO: Test Time Robustness via Adaptation and Augmentation [131.28104376280197]
テスト時間ロバスト化の問題、すなわちモデルロバスト性を改善するためにテストインプットを用いて検討する。
最近の先行研究ではテスト時間適応法が提案されているが、それぞれ追加の仮定を導入している。
モデルが確率的で適応可能な任意のテスト環境で使用できるシンプルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:55:11Z) - MonoPair: Monocular 3D Object Detection Using Pairwise Spatial
Relationships [11.149904308044356]
そこで本研究では,一対のサンプルの関係を考慮し,モノラルな3次元物体検出を改良する手法を提案する。
具体的には,近接する物体対の物体位置と3次元距離の不確実性を考慮した予測を行う。
実験により,提案手法は,最先端の競合他社よりも広いマージンで性能を向上し,KITTI 3D検出ベンチマークで最高の性能が得られることが示された。
論文 参考訳(メタデータ) (2020-03-01T15:37:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。