論文の概要: Domain Adaptive Detection of MAVs: A Benchmark and Noise Suppression Network
- arxiv url: http://arxiv.org/abs/2403.16669v1
- Date: Mon, 25 Mar 2024 12:07:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 14:58:36.577590
- Title: Domain Adaptive Detection of MAVs: A Benchmark and Noise Suppression Network
- Title(参考訳): MAVのドメイン適応検出:ベンチマークとノイズ抑制ネットワーク
- Authors: Yin Zhang, Jinhong Deng, Peidong Liu, Wen Li, Shiyu Zhao,
- Abstract要約: MAV検出の方法は、トレーニングセットとテストセットが同じ分布を持つと仮定する。
提案したデータセットに基づいて,クロスドメインMAV検出のための新しいベンチマークを提案する。
擬似ラベルの枠組みと大規模から小規模の訓練手順に基づく騒音抑制ネットワーク(NSN)
- 参考スコア(独自算出の注目度): 26.26788054611157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual detection of Micro Air Vehicles (MAVs) has attracted increasing attention in recent years due to its important application in various tasks. The existing methods for MAV detection assume that the training set and testing set have the same distribution. As a result, when deployed in new domains, the detectors would have a significant performance degradation due to domain discrepancy. In this paper, we study the problem of cross-domain MAV detection. The contributions of this paper are threefold. 1) We propose a Multi-MAV-Multi-Domain (M3D) dataset consisting of both simulation and realistic images. Compared to other existing datasets, the proposed one is more comprehensive in the sense that it covers rich scenes, diverse MAV types, and various viewing angles. A new benchmark for cross-domain MAV detection is proposed based on the proposed dataset. 2) We propose a Noise Suppression Network (NSN) based on the framework of pseudo-labeling and a large-to-small training procedure. To reduce the challenging pseudo-label noises, two novel modules are designed in this network. The first is a prior-based curriculum learning module for allocating adaptive thresholds for pseudo labels with different difficulties. The second is a masked copy-paste augmentation module for pasting truly-labeled MAVs on unlabeled target images and thus decreasing pseudo-label noises. 3) Extensive experimental results verify the superior performance of the proposed method compared to the state-of-the-art ones. In particular, it achieves mAP of 46.9%(+5.8%), 50.5%(+3.7%), and 61.5%(+11.3%) on the tasks of simulation-to-real adaptation, cross-scene adaptation, and cross-camera adaptation, respectively.
- Abstract(参考訳): 近年,マイクロエアビー (MAV) の視覚的検出が注目されている。
MAV検出のための既存の方法は、トレーニングセットとテストセットが同じ分布を持つと仮定する。
結果として、新しいドメインにデプロイされると、検出器はドメインの相違により性能が著しく低下する。
本稿では,クロスドメインMAV検出の問題について検討する。
本論文の貢献は3倍である。
1) シミュレーションと実写画像の両方からなるマルチMAV-Multi-Domain(M3D)データセットを提案する。
他の既存のデータセットと比較して、提案したデータセットは、リッチなシーン、多様なMAVタイプ、様々な視野角をカバーしているという意味で、より包括的なものである。
提案したデータセットに基づいて,クロスドメインMAV検出のための新しいベンチマークを提案する。
2) 擬似ラベリングの枠組みと大規模から小規模の訓練手順に基づくノイズ抑制ネットワーク(NSN)を提案する。
このネットワークでは、難易度の高い擬似ラベルノイズを低減するために、2つの新しいモジュールが設計されている。
1つ目は、異なる困難を持つ擬似ラベルに対して適応しきい値を設定するための、事前ベースのカリキュラム学習モジュールである。
2つ目は、未ラベルのターゲット画像に真にラベル付きMAVを貼り付け、擬似ラベルノイズを低減させるマスク付きコピーペースト拡張モジュールである。
3) 大規模実験により, 提案手法の精度を最先端の手法と比較して検証した。
特に、シミュレーション・トゥ・リアル・アダプティブ、クロスシーン・アダプティブ、クロスカメラ・アダプティブの各タスクにおいて、46.9%(+5.8%)、50.5%(+3.7%)、61.5%(+11.3%)のmAPを達成する。
関連論文リスト
- CTS: Sim-to-Real Unsupervised Domain Adaptation on 3D Detection [16.96201890965781]
本稿では,ラベル付きシミュレーションからラベル付き現実領域へモデルを転送するための新しいフレームワークを提案する。
実験結果から,提案手法は3次元物体検出モデルの実領域適応能力を大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-06-26T07:31:16Z) - M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.39134873744748]
既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-06-04T12:33:02Z) - Multi-Modal UAV Detection, Classification and Tracking Algorithm -- Technical Report for CVPR 2024 UG2 Challenge [20.459377705070043]
本報告では, CVPR 2024 UAV追跡・姿勢推定チャレンジにおける課題であるUG2+の初当選モデルについて述べる。
高精度なUAV分類・追跡のためのマルチモーダルなUAV検出・分類・3次元追跡手法を提案する。
本システムでは,最先端の分類手法と高度な後処理手順を統合し,精度と堅牢性を向上する。
論文 参考訳(メタデータ) (2024-05-26T07:21:18Z) - Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.875516787157018]
本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文 参考訳(メタデータ) (2024-03-15T03:58:17Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Density-Insensitive Unsupervised Domain Adaption on 3D Object Detection [19.703181080679176]
ポイントクラウドからの3Dオブジェクト検出は、安全クリティカルな自動運転において不可欠である。
本稿では,密度依存性ドメインギャップに対処する密度依存性ドメイン適応フレームワークを提案する。
3つの広く採用されている3次元オブジェクト検出データセットの実験結果から,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-19T06:33:07Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - AcroFOD: An Adaptive Method for Cross-domain Few-shot Object Detection [59.10314662986463]
クロスドメインの少数ショットオブジェクト検出は、いくつかの注釈付きターゲットデータで対象ドメイン内のオブジェクト検出器を適応することを目的としている。
提案手法は,複数のベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-22T10:23:40Z) - BatchFormerV2: Exploring Sample Relationships for Dense Representation
Learning [88.82371069668147]
BatchFormerV2はより一般的なバッチトランスフォーマーモジュールである。
BatchFormerV2は、現在のDETRベースの検出方法を1.3%以上改善している。
論文 参考訳(メタデータ) (2022-04-04T05:53:42Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。