論文の概要: MOR-UAV: A Benchmark Dataset and Baselines for Moving Object Recognition
in UAV Videos
- arxiv url: http://arxiv.org/abs/2008.01699v2
- Date: Sat, 8 Aug 2020 04:28:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 00:40:29.309438
- Title: MOR-UAV: A Benchmark Dataset and Baselines for Moving Object Recognition
in UAV Videos
- Title(参考訳): MOR-UAV:UAVビデオにおけるオブジェクト認識のためのベンチマークデータセットとベースライン
- Authors: Murari Mandal, Lav Kush Kumar, Santosh Kumar Vipparthi
- Abstract要約: 本稿では,空中映像における物体認識のための大規模ビデオデータセットであるMOR-UAVを紹介する。
さまざまなシナリオで10,948フレームからなる30UAVビデオから収集した89,783件の移動オブジェクトインスタンスに注釈を付ける。
UAVビデオにおけるMORのための深い統合フレームワークMOR-UAVNetを提案する。
- 参考スコア(独自算出の注目度): 12.25388945174071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual data collected from Unmanned Aerial Vehicles (UAVs) has opened a new
frontier of computer vision that requires automated analysis of aerial
images/videos. However, the existing UAV datasets primarily focus on object
detection. An object detector does not differentiate between the moving and
non-moving objects. Given a real-time UAV video stream, how can we both
localize and classify the moving objects, i.e. perform moving object
recognition (MOR)? The MOR is one of the essential tasks to support various UAV
vision-based applications including aerial surveillance, search and rescue,
event recognition, urban and rural scene understanding.To the best of our
knowledge, no labeled dataset is available for MOR evaluation in UAV videos.
Therefore, in this paper, we introduce MOR-UAV, a large-scale video dataset for
MOR in aerial videos. We achieve this by labeling axis-aligned bounding boxes
for moving objects which requires less computational resources than producing
pixel-level estimates. We annotate 89,783 moving object instances collected
from 30 UAV videos, consisting of 10,948 frames in various scenarios such as
weather conditions, occlusion, changing flying altitude and multiple camera
views. We assigned the labels for two categories of vehicles (car and heavy
vehicle). Furthermore, we propose a deep unified framework MOR-UAVNet for MOR
in UAV videos. Since, this is a first attempt for MOR in UAV videos, we present
16 baseline results based on the proposed framework over the MOR-UAV dataset
through quantitative and qualitative experiments. We also analyze the
motion-salient regions in the network through multiple layer visualizations.
The MOR-UAVNet works online at inference as it requires only few past frames.
Moreover, it doesn't require predefined target initialization from user.
Experiments also demonstrate that the MOR-UAV dataset is quite challenging.
- Abstract(参考訳): Unmanned Aerial Vehicles (UAVs)から収集された視覚データは、航空画像やビデオの自動解析を必要とするコンピュータビジョンの新しいフロンティアを開いた。
しかし、既存のUAVデータセットは主にオブジェクト検出に焦点を当てている。
物体検出器は、移動物体と非移動物体とを区別しない。
リアルタイムUAVビデオストリームを前提として、移動物体のローカライズと分類、すなわち移動物体認識(MOR)をどのように行うか。
MORは、航空監視、捜索・救助、イベント認識、都市・農村の風景理解など、UAVの視覚に基づく様々なアプリケーションをサポートするための重要なタスクの1つであり、我々の知る限り、UAVビデオでのMOR評価にラベル付きデータセットは利用できない。
そこで本稿では,MORの大規模ビデオデータセットであるMOR-UAVについて紹介する。
我々は,ピクセルレベルの推定値を生成するよりも計算資源の少ない移動物体に対して,軸方向の有界ボックスをラベル付けすることでこれを実現する。
30UAVビデオから収集した89,783件の移動物体を,気象条件や閉塞,飛行高度の変化,複数のカメラビューなど,さまざまなシナリオで10,948件のフレームで注釈した。
ラベルを2つのカテゴリ(車と重車)に割り当てました。
さらに,UAVビデオにおけるMORのための深層統合フレームワークMOR-UAVNetを提案する。
これはUAVビデオにおけるMORの最初の試みであるため、定量的および定性的な実験を通じて提案したMOR-UAVデータセット上のフレームワークに基づく16のベースライン結果を示す。
また,複数の層を可視化し,ネットワーク内の動きに富む領域を解析した。
MOR-UAVNetは、数フレームしか必要としないため、オンラインで動作します。
さらに、ユーザから事前定義されたターゲット初期化は必要ありません。
また実験により、MOR-UAVデータセットは非常に難しいことが示されている。
関連論文リスト
- UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles [12.278437831053985]
無人航空機(UAV)は、航空写真、監視、農業など多くの用途で使用されている。
UAVアプリケーションの既存のベンチマークは、主に従来の2D認識タスクのために設計されている。
UAV3Dは1000のシーンで構成され、それぞれに20のフレームと完全な注釈付き3Dバウンディングボックスがある。
論文 参考訳(メタデータ) (2024-10-14T22:24:11Z) - EVD4UAV: An Altitude-Sensitive Benchmark to Evade Vehicle Detection in UAV [19.07281015014683]
無人航空機(UAV)の撮影画像における車両検出は、航空写真やリモートセンシングに広く応用されている。
近年の研究では、物体に対向パッチを加えることで、よく訓練されたディープニューラルネットワークベースの物体検出器を騙すことが示されている。
UAVにおける車両検出を回避するための高度感度ベンチマークとしてEVD4UAVという新しいデータセットを提案する。
論文 参考訳(メタデータ) (2024-03-08T16:19:39Z) - Real Time Human Detection by Unmanned Aerial Vehicles [0.0]
公安のための重要な2つのデータソースは、無人航空機(UAV)によって生成された熱赤外(TIR)リモートセンシング写真とビデオである。
ターゲットの小型化,複雑なシーン情報,視聴可能なビデオに対する低解像度化,ラベル付きデータセットやトレーニングモデルのデジェスなどにより,オブジェクト検出は依然として困難である。
本研究では,写真やビデオのためのUAV TIRオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-06T18:28:01Z) - Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve
Aerial Visual Perception? [57.77643186237265]
我々は、異なる視点から同期シーンを記録するビデオデータセットであるMultiview Aerial Visual RECgnition(MAVREC)を提示する。
MAVRECは約2.5時間、業界標準の2.7K解像度ビデオシーケンス、0.5万フレーム以上のフレーム、11万の注釈付きバウンディングボックスで構成されている。
これにより、MAVRECは地上および空中ビューのデータセットとして最大であり、ドローンベースのデータセットの中では4番目に大きい。
論文 参考訳(メタデータ) (2023-12-07T18:59:14Z) - Evidential Detection and Tracking Collaboration: New Problem, Benchmark
and Algorithm for Robust Anti-UAV System [56.51247807483176]
無人航空機(UAV)は輸送、監視、軍事など多くの地域で広く使われている。
従来は、UAVの先行情報が常に提供されていた追跡問題として、このようなアンチUAVタスクを単純化していた。
本稿では,従来のUAV情報を含まない複雑な場面において,UAVの認識を特徴とする新しい実用的対UAV問題を初めて定式化する。
論文 参考訳(メタデータ) (2023-06-27T19:30:23Z) - Learning to Compress Unmanned Aerial Vehicle (UAV) Captured Video:
Benchmark and Analysis [54.07535860237662]
本稿では,UAVビデオ符号化学習のための新しいタスクを提案し,そのようなタスクに対する包括的で体系的なベンチマークを構築する。
このベンチマークは、ドローンプラットフォームにおけるビデオコーディングの研究と開発を加速させるものと期待されている。
論文 参考訳(メタデータ) (2023-01-15T15:18:02Z) - BEV-MODNet: Monocular Camera based Bird's Eye View Moving Object
Detection for Autonomous Driving [2.9769485817170387]
CNNは、現場のグローバルコンテキストを活用して、より良いプロジェクトを作成することができる。
我々は、BEV空間内で5つのクラスを移動するオブジェクトマスクのアノテーションを備えた12.9k画像からなる拡張KITTI-rawデータセットを作成する。
簡単なベースライン実装を用いてmIoUの13%の大幅な改善を観測した。
論文 参考訳(メタデータ) (2021-07-11T01:11:58Z) - Few-Shot Learning for Video Object Detection in a Transfer-Learning
Scheme [70.45901040613015]
ビデオ物体検出のための数発学習の新たな課題について検討する。
我々は,多数のベースクラスオブジェクトに対して映像物体検出を効果的に訓練するトランスファー学習フレームワークと,ノベルクラスオブジェクトのいくつかのビデオクリップを用いる。
論文 参考訳(メタデータ) (2021-03-26T20:37:55Z) - Anti-UAV: A Large Multi-Modal Benchmark for UAV Tracking [59.06167734555191]
Unmanned Aerial Vehicle (UAV)は、商業とレクリエーションの両方に多くの応用を提供している。
我々は、UAVを追跡し、位置や軌道などの豊富な情報を提供するという課題を考察する。
300以上のビデオペアが580k以上の手動で注釈付きバウンディングボックスを含むデータセット、Anti-UAVを提案します。
論文 参考訳(メタデータ) (2021-01-21T07:00:15Z) - Perceiving Traffic from Aerial Images [86.994032967469]
本研究では,空中画像中の物体を検出するために,バタフライ検出器と呼ばれる物体検出手法を提案する。
UAVDT(UAVDT)とVisDrone 2019(VisDrone 2019)の2つのUAVデータセット上でButterfly Detectorを評価し、従来の最先端の手法よりも高速に動作し、かつリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-09-16T11:37:43Z) - AU-AIR: A Multi-modal Unmanned Aerial Vehicle Dataset for Low Altitude
Traffic Surveillance [20.318367304051176]
カメラを搭載した無人航空機(UAV)は、空中(バードビュー)画像を撮影する利点がある。
オブジェクトアノテーションによる視覚データを含む、いくつかの空中データセットが導入されている。
本研究では,実環境下で収集されたマルチモーダルセンサデータを有する多目的航空データセット(AU-AIR)を提案する。
論文 参考訳(メタデータ) (2020-01-31T09:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。