論文の概要: How Far are Modern Trackers from UAV-Anti-UAV? A Million-Scale Benchmark and New Baseline
- arxiv url: http://arxiv.org/abs/2512.07385v1
- Date: Mon, 08 Dec 2025 10:19:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.834554
- Title: How Far are Modern Trackers from UAV-Anti-UAV? A Million-Scale Benchmark and New Baseline
- Title(参考訳): UAV-Anti-UAVの現代のトラッカーはどこまであるか? 数百万のベンチマークと新しいベースライン
- Authors: Chunhui Zhang, Li Liu, Zhipeng Zhang, Yong Wang, Hao Wen, Xi Zhou, Shiming Ge, Yanfeng Wang,
- Abstract要約: 無人航空機(UAV)は広範囲のアプリケーションを提供するが、安全性とプライバシー侵害のリスクも大きい。
現在の反UAV研究は、主に固定地上カメラで撮影したRGB、赤外線(IR)、またはRGB-IRビデオに焦点を当てている。
本稿では,UAV-Anti-UAVと呼ばれるマルチモーダル視覚追跡タスクを提案する。
- 参考スコア(独自算出の注目度): 74.4054700050366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unmanned Aerial Vehicles (UAVs) offer wide-ranging applications but also pose significant safety and privacy violation risks in areas like airport and infrastructure inspection, spurring the rapid development of Anti-UAV technologies in recent years. However, current Anti-UAV research primarily focuses on RGB, infrared (IR), or RGB-IR videos captured by fixed ground cameras, with little attention to tracking target UAVs from another moving UAV platform. To fill this gap, we propose a new multi-modal visual tracking task termed UAV-Anti-UAV, which involves a pursuer UAV tracking a target adversarial UAV in the video stream. Compared to existing Anti-UAV tasks, UAV-Anti-UAV is more challenging due to severe dual-dynamic disturbances caused by the rapid motion of both the capturing platform and the target. To advance research in this domain, we construct a million-scale dataset consisting of 1,810 videos, each manually annotated with bounding boxes, a language prompt, and 15 tracking attributes. Furthermore, we propose MambaSTS, a Mamba-based baseline method for UAV-Anti-UAV tracking, which enables integrated spatial-temporal-semantic learning. Specifically, we employ Mamba and Transformer models to learn global semantic and spatial features, respectively, and leverage the state space model's strength in long-sequence modeling to establish video-level long-term context via a temporal token propagation mechanism. We conduct experiments on the UAV-Anti-UAV dataset to validate the effectiveness of our method. A thorough experimental evaluation of 50 modern deep tracking algorithms demonstrates that there is still significant room for improvement in the UAV-Anti-UAV domain. The dataset and codes will be available at {\color{magenta}https://github.com/983632847/Awesome-Multimodal-Object-Tracking}.
- Abstract(参考訳): 無人航空機(UAV)は広範囲の用途を提供するが、空港やインフラ検査などの分野での安全性やプライバシー侵害の重大なリスクも生じており、近年の反UAV技術の急速な発展に拍車を掛けている。
しかしながら、現在の反UAV研究は、主にRGB、赤外線(IR)、または固定地上カメラによって撮影されたRGB-IRビデオに焦点を当てており、他の移動中のUAVプラットフォームから標的のUAVを追跡することにはほとんど注意を払っていない。
このギャップを埋めるために,UAV-Anti-UAVと呼ばれるマルチモーダル視覚追跡タスクを提案する。
既存の対UAVタスクと比較して、UAV-Anti-UAVは、捕獲プラットフォームと目標の両方の急激な動きによって引き起こされる重度の二重流体障害により、より困難である。
この領域の研究を進めるために、1,810本のビデオからなる100万件のデータセットを構築し,それぞれに境界ボックス,言語プロンプト,および15のトラッキング属性を手動でアノテートする。
さらに,マンバをベースとしたUAV-Anti-UAV追跡手法であるMambaSTSを提案する。
具体的には,マンバモデルとトランスフォーマーモデルを用いてグローバルな意味的特徴と空間的特徴を学習し,時系列モデリングにおける状態空間モデルの強みを活用して,時間的トークン伝搬機構によるビデオレベルの長期コンテキストを確立する。
提案手法の有効性を検証するために,UAV-Anti-UAVデータセットの実験を行った。
50の最新のディープトラッキングアルゴリズムの徹底的な実験的評価は、UAV-Anti-UAV領域にはまだ改善の余地があることを証明している。
データセットとコードは {\color{magenta}https://github.com/983632847/Awesome-Multimodal-Object-Tracking}で公開される。
関連論文リスト
- UAVDB: Point-Guided Masks for UAV Detection and Segmentation [0.03464344220266879]
UAVの検出とセグメンテーションのための新しいベンチマークデータセットであるUAVDBを提案する。
ポイント誘導の弱い監視パイプライン上に構築されている。
UAVDBは、可視オブジェクトからほぼ1ピクセルのインスタンスまで、さまざまなスケールでUAVをキャプチャする。
論文 参考訳(メタデータ) (2024-09-09T13:27:53Z) - Tiny Multi-Agent DRL for Twins Migration in UAV Metaverses: A Multi-Leader Multi-Follower Stackelberg Game Approach [57.15309977293297]
無人航空機(UAV)とメタバースの相乗効果は、UAVメタバースと呼ばれる新しいパラダイムを生み出している。
本稿では,UAVメタバースにおける効率的なUTマイグレーションのためのプルーニング技術に基づく,機械学習に基づく小さなゲームフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-18T02:14:13Z) - Evidential Detection and Tracking Collaboration: New Problem, Benchmark
and Algorithm for Robust Anti-UAV System [56.51247807483176]
無人航空機(UAV)は輸送、監視、軍事など多くの地域で広く使われている。
従来は、UAVの先行情報が常に提供されていた追跡問題として、このようなアンチUAVタスクを単純化していた。
本稿では,従来のUAV情報を含まない複雑な場面において,UAVの認識を特徴とする新しい実用的対UAV問題を初めて定式化する。
論文 参考訳(メタデータ) (2023-06-27T19:30:23Z) - Learning to Compress Unmanned Aerial Vehicle (UAV) Captured Video:
Benchmark and Analysis [54.07535860237662]
本稿では,UAVビデオ符号化学習のための新しいタスクを提案し,そのようなタスクに対する包括的で体系的なベンチマークを構築する。
このベンチマークは、ドローンプラットフォームにおけるビデオコーディングの研究と開発を加速させるものと期待されている。
論文 参考訳(メタデータ) (2023-01-15T15:18:02Z) - Vision-based Anti-UAV Detection and Tracking [18.307952561941942]
無人航空機(UAV)は様々な分野で広く使われており、セキュリティやプライバシーへの侵入が社会の関心を喚起している。
本稿では,ダリアン工科大学アンチUAVデータセット,DUTアンチUAVという可視光モードデータセットを提案する。
検出データセットには、合計1万の画像と、短期および長期のシーケンスを含む20のビデオの追跡データセットが含まれている。
論文 参考訳(メタデータ) (2022-05-22T15:21:45Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。