論文の概要: UAV-CB: A Complex-Background RGB-T Dataset and Local Frequency Bridge Network for UAV Detection
- arxiv url: http://arxiv.org/abs/2603.17492v1
- Date: Wed, 18 Mar 2026 08:55:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.588373
- Title: UAV-CB: A Complex-Background RGB-T Dataset and Local Frequency Bridge Network for UAV Detection
- Title(参考訳): UAV-CB:UAV検出のための複雑な背景RGB-Tデータセットと局所周波数ブリッジネットワーク
- Authors: Shenghui Huang, Menghao Hu, Longkun Zou, Hongyu Chi, Zekai Li, Feng Gao, Fan Yang, Qingyao Wu, Ke Chen,
- Abstract要約: 現実のシナリオでは、UAVは建物、植生、電力線などの周囲の構造物と視覚的に混ざり合っていることが多い。
既存のUAV検出データセットは様々だが、これらのカモフラージュと複雑な背景の課題を捉えるために特別に設計されたものではない。
我々は、低高度背景とカモフラージュ特性を強調するために意図的にキュレートされた新しいRGB-T UAV検出データセットであるUAV-CBを構築した。
また、RGB-T核融合における周波数-空間融合ギャップとモード間差ギャップを橋渡しするために、局所周波数空間を特徴付けるローカル周波数ブリッジネットワーク(LFBNet)を提案する。
- 参考スコア(独自算出の注目度): 23.481887931930004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting Unmanned Aerial Vehicles (UAVs) in low-altitude environments is essential for perception and defense systems but remains highly challenging due to complex backgrounds, camouflage, and multimodal interference. In real-world scenarios, UAVs are frequently visually blended with surrounding structures such as buildings, vegetation, and power lines, resulting in low contrast, weak boundaries, and strong confusion with cluttered background textures. Existing UAV detection datasets, though diverse, are not specifically designed to capture these camouflage and complex-background challenges, which limits progress toward robust real-world perception. To fill this gap, we construct UAV-CB, a new RGB-T UAV detection dataset deliberately curated to emphasize complex low-altitude backgrounds and camouflage characteristics. Furthermore, we propose the Local Frequency Bridge Network (LFBNet), which models features in localized frequency space to bridge both the frequency-spatial fusion gap and the cross-modality discrepancy gap in RGB-T fusion. Extensive experiments on UAV-CB and public benchmarks demonstrate that LFBNet achieves state-of-the-art detection performance and strong robustness under camouflaged and cluttered conditions, offering a frequency-aware perspective on multimodal UAV perception in real-world applications.
- Abstract(参考訳): 低高度環境下で無人航空機(UAV)を検出することは、認識と防衛システムには不可欠であるが、複雑な背景、カモフラージュ、マルチモーダル干渉のために非常に困難である。
現実のシナリオでは、UAVは建物、植生、電力線などの周囲の構造物と視覚的に混ざり合っており、コントラストが低く、境界が弱く、背景のぼやけたテクスチャとの強い混ざり合っている。
既存のUAV検出データセットは様々だが、これらの迷彩と複雑な背景の課題を捉えるために特別に設計されたものではない。
このギャップを埋めるために、複雑な低高度背景とカモフラージュ特性を強調するために意図的にキュレートされた新しいRGB-T UAV検出データセットであるUAV-CBを構築した。
さらに,RGB-T融合における周波数-空間融合ギャップとモード間差ギャップの両方を橋渡しするために,局所周波数空間の特徴をモデル化するローカル周波数ブリッジネットワーク(LFBNet)を提案する。
UAV-CBおよび公開ベンチマークに関する大規模な実験により、LFBNetは、実世界のアプリケーションにおけるマルチモーダルUAV知覚に対する周波数認識の視点を提供し、キャモフラージュや散在した条件下で、最先端の検知性能と強靭性を達成することを示した。
関連論文リスト
- UAV-MM3D: A Large-Scale Synthetic Benchmark for 3D Perception of Unmanned Aerial Vehicles with Multi-Modal Data [47.317955428393134]
UAV-MM3Dは,低高度UAV知覚と動作理解のための多モード合成データセットである。
様々なシーン(都市部、郊外部、森林部、沿岸部)と気象条件にまたがる400Kの同期フレームで構成されている。
各フレームは2D/3Dバウンディングボックス、6-DoFのポーズ、インスタンスレベルのアノテーションを提供し、3D検出、ポーズ推定、ターゲット追跡、短期軌道予測などのUAVに関連するコアタスクを可能にする。
論文 参考訳(メタデータ) (2025-11-27T12:30:28Z) - Unified Unsupervised Anomaly Detection via Matching Cost Filtering [113.43366521994396]
教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
論文 参考訳(メタデータ) (2025-10-03T03:28:18Z) - More Clear, More Flexible, More Precise: A Comprehensive Oriented Object Detection benchmark for UAV [58.89234732689013]
CODroneは、現実の状況を正確に反映した、UAVのための包括的なオブジェクト指向オブジェクト検出データセットである。
また、下流のタスク要求に合わせて設計された新しいベンチマークとしても機能する。
我々は、CODroneを厳格に評価するために、22の古典的またはSOTA法に基づく一連の実験を行う。
論文 参考訳(メタデータ) (2025-04-28T17:56:02Z) - Bringing RGB and IR Together: Hierarchical Multi-Modal Enhancement for Robust Transmission Line Detection [67.02804741856512]
高速かつ高精度なTL検出のために,RGBとIRデータを統合したHMMEN(Hierarchical Multi-Modal Enhancement Network)を提案する。
提案手法では,(1)階層的RGBおよびIR特徴写像を大まかに融合・拡張するMMEB,(2)デコーダ出力とIR特徴写像の不整合を変形可能な畳み込みを利用して補正するFAB,の2つの重要な構成要素を紹介する。
論文 参考訳(メタデータ) (2025-01-25T06:21:06Z) - UAVDB: Point-Guided Masks for UAV Detection and Segmentation [0.03464344220266879]
UAVの検出とセグメンテーションのための新しいベンチマークデータセットであるUAVDBを提案する。
ポイント誘導の弱い監視パイプライン上に構築されている。
UAVDBは、可視オブジェクトからほぼ1ピクセルのインスタンスまで、さまざまなスケールでUAVをキャプチャする。
論文 参考訳(メタデータ) (2024-09-09T13:27:53Z) - Vision-Based UAV Self-Positioning in Low-Altitude Urban Environments [20.69412701553767]
無人航空機(UAV)は安定した位置決めのために衛星システムに依存している。
このような状況下では、視覚に基づく技術が代替手段として機能し、UAVの自己配置能力を確実にする。
本稿では,UAV自己配置タスク用に設計された最初の公開データセットであるDenseUAVを提案する。
論文 参考訳(メタデータ) (2022-01-23T07:18:55Z) - Drone-based RGB-Infrared Cross-Modality Vehicle Detection via
Uncertainty-Aware Learning [59.19469551774703]
ドローンによる車両検出は、空中画像中の車両の位置とカテゴリーを見つけることを目的としている。
我々はDroneVehicleと呼ばれる大規模ドローンベースのRGB赤外線車両検出データセットを構築した。
私たちのDroneVehicleは28,439RGBの赤外線画像を収集し、都市道路、住宅地、駐車場、その他のシナリオを昼から夜までカバーしています。
論文 参考訳(メタデータ) (2020-03-05T05:29:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。