論文の概要: WebUAV-3M: A Benchmark Unveiling the Power of Million-Scale Deep UAV
Tracking
- arxiv url: http://arxiv.org/abs/2201.07425v1
- Date: Wed, 19 Jan 2022 05:39:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-20 21:59:49.986300
- Title: WebUAV-3M: A Benchmark Unveiling the Power of Million-Scale Deep UAV
Tracking
- Title(参考訳): WebUAV-3M: 数百万ものUAV追跡のパワーを示すベンチマーク
- Authors: Chunhui Zhang, Guanjie Huang, Li Liu, Shan Huang, Yinan Yang, Yuxuan
Zhang, Xiang Wan, Shiming Ge
- Abstract要約: WebUAV-3Mは100万スケールの無人航空機(UAV)追跡ベンチマークである。
われわれは、インターネットから3Mフレーム以上の4,485本のビデオを集めている。
WebUAV-3Mは、公的なUAV追跡ベンチマークとしては最大である。
- 参考スコア(独自算出の注目度): 40.83427270297245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we contribute a new million-scale Unmanned Aerial Vehicle (UAV)
tracking benchmark, called WebUAV-3M. Firstly, we collect 4,485 videos with
more than 3M frames from the Internet. Then, an efficient and scalable
Semi-Automatic Target Annotation (SATA) pipeline is devised to label the
tremendous WebUAV-3M in every frame. To the best of our knowledge, the densely
bounding box annotated WebUAV-3M is by far the largest public UAV tracking
benchmark. We expect to pave the way for the follow-up study in the UAV
tracking by establishing a million-scale annotated benchmark covering a wide
range of target categories. Moreover, considering the close connections among
visual appearance, natural language and audio, we enrich WebUAV-3M by providing
natural language specification and audio description, encouraging the
exploration of natural language features and audio cues for UAV tracking.
Equipped with this benchmark, we delve into million-scale deep UAV tracking
problems, aiming to provide the community with a dedicated large-scale
benchmark for training deep UAV trackers and evaluating UAV tracking
approaches. Extensive experiments on WebUAV-3M demonstrate that there is still
a big room for robust deep UAV tracking improvements. The dataset, toolkits and
baseline results will be available at
\url{https://github.com/983632847/WebUAV-3M}.
- Abstract(参考訳): 本研究は,WebUAV-3M(Unmanned Aerial Vehicle (UAV)) と呼ばれる新しい100万台の無人航空機の追跡ベンチマークに貢献する。
まず、インターネットから3Mフレーム以上の4,485本のビデオを収集します。
次に,SATA(Semi-Automatic Target Annotation)パイプラインを設計し,各フレームに巨大なWebUAV-3Mをラベル付けする。
我々の知る限りでは、密接なバウンディングボックスのWebUAV-3Mは、UAV追跡ベンチマークで最大のものである。
幅広い対象カテゴリをカバーする100万規模のアノテートベンチマークを確立することで、UAV追跡におけるフォローアップ研究の道を開くことを期待する。
さらに,視覚的外観,自然言語,音声の密接な関係を考慮し,自然言語仕様と音声記述を提供することでWebUAV-3Mを充実させ,UAV追跡のための自然言語特徴と音声の探索を奨励する。
このベンチマークと合わせて、100万件のUAV追跡問題を掘り下げ、深いUAVトラッカーをトレーニングし、UAV追跡アプローチを評価するための大規模なベンチマークをコミュニティに提供することを目的としています。
WebUAV-3Mの大規模な実験は、依然として強力なUAV追跡の改善の余地があることを実証している。
データセット、ツールキット、ベースラインの結果は \url{https://github.com/983632847/webuav-3m} で入手できる。
関連論文リスト
- UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles [12.278437831053985]
無人航空機(UAV)は、航空写真、監視、農業など多くの用途で使用されている。
UAVアプリケーションの既存のベンチマークは、主に従来の2D認識タスクのために設計されている。
UAV3Dは1000のシーンで構成され、それぞれに20のフレームと完全な注釈付き3Dバウンディングボックスがある。
論文 参考訳(メタデータ) (2024-10-14T22:24:11Z) - Tiny Multi-Agent DRL for Twins Migration in UAV Metaverses: A Multi-Leader Multi-Follower Stackelberg Game Approach [57.15309977293297]
無人航空機(UAV)とメタバースの相乗効果は、UAVメタバースと呼ばれる新しいパラダイムを生み出している。
本稿では,UAVメタバースにおける効率的なUTマイグレーションのためのプルーニング技術に基づく,機械学習に基づく小さなゲームフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-18T02:14:13Z) - Evidential Detection and Tracking Collaboration: New Problem, Benchmark
and Algorithm for Robust Anti-UAV System [56.51247807483176]
無人航空機(UAV)は輸送、監視、軍事など多くの地域で広く使われている。
従来は、UAVの先行情報が常に提供されていた追跡問題として、このようなアンチUAVタスクを単純化していた。
本稿では,従来のUAV情報を含まない複雑な場面において,UAVの認識を特徴とする新しい実用的対UAV問題を初めて定式化する。
論文 参考訳(メタデータ) (2023-06-27T19:30:23Z) - Learning to Compress Unmanned Aerial Vehicle (UAV) Captured Video:
Benchmark and Analysis [54.07535860237662]
本稿では,UAVビデオ符号化学習のための新しいタスクを提案し,そのようなタスクに対する包括的で体系的なベンチマークを構築する。
このベンチマークは、ドローンプラットフォームにおけるビデオコーディングの研究と開発を加速させるものと期待されている。
論文 参考訳(メタデータ) (2023-01-15T15:18:02Z) - Rank-Based Filter Pruning for Real-Time UAV Tracking [11.740436885164833]
無人航空機(UAV)の追跡は、農業、航法、公共の安全など、幅広い可能性を持つ。
識別相関フィルタ (DCF) トラッカーは, 高い効率性のため, UAV追跡コミュニティにおいて際立っている。
モデル圧縮は、DCFとディープラーニングベースのトラッカーのギャップを狭めるための有望な方法である。
論文 参考訳(メタデータ) (2022-07-05T02:13:53Z) - Vision-based Anti-UAV Detection and Tracking [18.307952561941942]
無人航空機(UAV)は様々な分野で広く使われており、セキュリティやプライバシーへの侵入が社会の関心を喚起している。
本稿では,ダリアン工科大学アンチUAVデータセット,DUTアンチUAVという可視光モードデータセットを提案する。
検出データセットには、合計1万の画像と、短期および長期のシーケンスを含む20のビデオの追跡データセットが含まれている。
論文 参考訳(メタデータ) (2022-05-22T15:21:45Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。