論文の概要: Ground-to-Aerial Person Search: Benchmark Dataset and Approach
- arxiv url: http://arxiv.org/abs/2308.12712v1
- Date: Thu, 24 Aug 2023 11:11:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 14:16:17.257865
- Title: Ground-to-Aerial Person Search: Benchmark Dataset and Approach
- Title(参考訳): 対aerial person search:ベンチマークデータセットとアプローチ
- Authors: Shizhou Zhang, Qingchun Yang, De Cheng, Yinghui Xing, Guoqiang Liang,
Peng Wang, Yanning Zhang
- Abstract要約: 我々はG2APSという,地上から航空への人物探索のための大規模データセットを構築した。
G2APSには、UAVと地上監視カメラの両方に2,644個のアイデンティティを持つ260,559個の注釈付きバウンディングボックスの31,770枚の画像が含まれている。
- 参考スコア(独自算出の注目度): 42.54151390290665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we construct a large-scale dataset for Ground-to-Aerial Person
Search, named G2APS, which contains 31,770 images of 260,559 annotated bounding
boxes for 2,644 identities appearing in both of the UAVs and ground
surveillance cameras. To our knowledge, this is the first dataset for
cross-platform intelligent surveillance applications, where the UAVs could work
as a powerful complement for the ground surveillance cameras. To more
realistically simulate the actual cross-platform Ground-to-Aerial surveillance
scenarios, the surveillance cameras are fixed about 2 meters above the ground,
while the UAVs capture videos of persons at different location, with a variety
of view-angles, flight attitudes and flight modes. Therefore, the dataset has
the following unique characteristics: 1) drastic view-angle changes between
query and gallery person images from cross-platform cameras; 2) diverse
resolutions, poses and views of the person images under 9 rich real-world
scenarios. On basis of the G2APS benchmark dataset, we demonstrate detailed
analysis about current two-step and end-to-end person search methods, and
further propose a simple yet effective knowledge distillation scheme on the
head of the ReID network, which achieves state-of-the-art performances on both
of the G2APS and the previous two public person search datasets, i.e., PRW and
CUHK-SYSU. The dataset and source code available on
\url{https://github.com/yqc123456/HKD_for_person_search}.
- Abstract(参考訳): 本研究では,UAVと地上監視カメラの両方に2,644のアイデンティティを持つ260,559個の注釈付きバウンダリングボックスの31,770枚の画像を含む地上対航空パーソナリティ検索のための大規模データセットG2APSを構築した。
私たちの知る限り、これはクロスプラットフォームのインテリジェントな監視アプリケーションのための最初のデータセットであり、UAVは地上監視カメラの強力な補完となる可能性がある。
実際の対地対空監視シナリオをより現実的にシミュレートするために、監視カメラは地上約2メートルの地点で固定され、uavsはさまざまな視野角、飛行姿勢、飛行モードで異なる場所にいる人のビデオを撮影する。
したがって、データセットには次のような特徴がある。
1) クロスプラットフォームカメラからの問合せ画像とギャラリー人物画像との劇的な視角変化
2)9つの豊かな実世界シナリオの下での人物像の多様な解像度、ポーズ、ビュー。
G2APSベンチマークデータセットに基づいて、現在の2段階とエンドツーエンドの人物探索手法を詳細に分析し、さらに、G2APSと以前の2つの公開人検索データセット(PRWとCUHK-SYSU)の両方で最先端のパフォーマンスを実現するReIDネットワークの頭上で、単純かつ効果的な知識蒸留方式を提案する。
データセットとソースコードは \url{https://github.com/yqc123456/hkd_for_person_search}にある。
関連論文リスト
- Game4Loc: A UAV Geo-Localization Benchmark from Game Data [0.0]
クロスビューペアデータの部分的マッチングを含む,より実用的なUAV測位タスクを提案する。
実験により,UAV測地のためのデータとトレーニング手法の有効性が示された。
論文 参考訳(メタデータ) (2024-09-25T13:33:28Z) - Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach [37.53617620654204]
我々はG2A-VReIDという地上から地上までの映像に基づく人物再同定のための大規模ベンチマークデータセットを構築した。
G2A-VReIDデータセットには次のような特徴がある: 1) 劇的な視点の変化; 2) 注釈付きアイデンティティの多さ; 3) リッチ屋外シナリオ; 4) 解像度の大きな差。
論文 参考訳(メタデータ) (2024-08-14T12:29:49Z) - AG-ReID.v2: Bridging Aerial and Ground Views for Person Re-identification [39.58286453178339]
空中人物再識別(Re-ID)は、コンピュータビジョンにおいて固有の課題を提示する。
AG-ReID.v2は、空中および地上の混合シナリオにおいて、人物Re-ID用に特別に設計されたデータセットである。
このデータセットは、1,615人のユニークな個人の100,502枚の画像で構成され、それぞれに一致するIDと15のソフト属性ラベルが付加されている。
論文 参考訳(メタデータ) (2024-01-05T04:53:33Z) - Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve
Aerial Visual Perception? [57.77643186237265]
我々は、異なる視点から同期シーンを記録するビデオデータセットであるMultiview Aerial Visual RECgnition(MAVREC)を提示する。
MAVRECは約2.5時間、業界標準の2.7K解像度ビデオシーケンス、0.5万フレーム以上のフレーム、11万の注釈付きバウンディングボックスで構成されている。
これにより、MAVRECは地上および空中ビューのデータセットとして最大であり、ドローンベースのデータセットの中では4番目に大きい。
論文 参考訳(メタデータ) (2023-12-07T18:59:14Z) - Aerial-Ground Person Re-ID [43.241435887373804]
我々は,航空カメラと地上カメラをまたいで,人による再IDマッチングを行う新しいベンチマークデータセット AG-ReID を提案する。
データセットには、388のアイデンティティの21,983のイメージと、各IDに対する15のソフト属性が含まれている。
データは、高度15~45mのUAVと、大学のキャンパスで地上のCCTVカメラによって収集されました。
論文 参考訳(メタデータ) (2023-03-15T13:07:21Z) - Perceiving Traffic from Aerial Images [86.994032967469]
本研究では,空中画像中の物体を検出するために,バタフライ検出器と呼ばれる物体検出手法を提案する。
UAVDT(UAVDT)とVisDrone 2019(VisDrone 2019)の2つのUAVデータセット上でButterfly Detectorを評価し、従来の最先端の手法よりも高速に動作し、かつリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-09-16T11:37:43Z) - Multiview Detection with Feature Perspective Transformation [59.34619548026885]
本稿では,新しいマルチビュー検出システムMVDetを提案する。
我々は,平面上に特徴写像を投影することで,多視点情報を集約するアンカーフリーアプローチを採っている。
私たちのモデル全体がエンドツーエンドで学習可能で、標準のWildtrackデータセットで88.2%のMODAを実現しています。
論文 参考訳(メタデータ) (2020-07-14T17:58:30Z) - University-1652: A Multi-view Multi-source Benchmark for Drone-based
Geo-localization [87.74121935246937]
我々は、ドローンによるジオローカライゼーションのための新しいマルチビューベンチマーク、University-1652を紹介する。
大学1652は、世界中の1,652の大学の建物から合成ドローン、衛星、地上カメラなどの3つのプラットフォームからのデータを含んでいる。
実験の結果,University-1652は視点不変の特徴の学習を支援し,実世界のシナリオにおいて優れた一般化能力を有することが示された。
論文 参考訳(メタデータ) (2020-02-27T15:24:15Z) - Detection and Tracking Meet Drones Challenge [131.31749447313197]
本稿では、オブジェクト検出・追跡データセットとベンチマークのレビューを行い、手動アノテーションによる大規模ドローンによるオブジェクト検出・追跡データセットの収集の課題について論じる。
当社のVisDroneデータセットは、中国北部から南部にかけての14の都市部と郊外部で収集されたものです。
本稿では,ドローンにおける大規模物体検出・追跡の現場の現状を詳細に分析し,今後の方向性を提案するとともに,課題を結論づける。
論文 参考訳(メタデータ) (2020-01-16T00:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。