論文の概要: NOMAD: A Natural, Occluded, Multi-scale Aerial Dataset, for Emergency
Response Scenarios
- arxiv url: http://arxiv.org/abs/2309.09518v1
- Date: Mon, 18 Sep 2023 06:57:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:52:34.975514
- Title: NOMAD: A Natural, Occluded, Multi-scale Aerial Dataset, for Emergency
Response Scenarios
- Title(参考訳): NOMAD:緊急対応シナリオのための自然に蓄積されたマルチスケール航空データセット
- Authors: Arturo Miguel Russell Bernal, Walter Scheirer, Jane Cleland-Huang
- Abstract要約: Natural Occluded Multi-scale Aerial dataset (NOMAD)は、人体検知のためのベンチマークデータセットである。
NOMADは100種類のアクターで構成されており、全て歩いたり、横たわったり、隠れたりしている。
42,825フレームを含み、5.4kの解像度ビデオから抽出され、バウンディングボックスと10の異なる視界レベルを示すラベルで手動で注釈付けされている。
- 参考スコア(独自算出の注目度): 44.82552796083844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the increasing reliance on small Unmanned Aerial Systems (sUAS) for
Emergency Response Scenarios, such as Search and Rescue, the integration of
computer vision capabilities has become a key factor in mission success.
Nevertheless, computer vision performance for detecting humans severely
degrades when shifting from ground to aerial views. Several aerial datasets
have been created to mitigate this problem, however, none of them has
specifically addressed the issue of occlusion, a critical component in
Emergency Response Scenarios. Natural Occluded Multi-scale Aerial Dataset
(NOMAD) presents a benchmark for human detection under occluded aerial views,
with five different aerial distances and rich imagery variance. NOMAD is
composed of 100 different Actors, all performing sequences of walking, laying
and hiding. It includes 42,825 frames, extracted from 5.4k resolution videos,
and manually annotated with a bounding box and a label describing 10 different
visibility levels, categorized according to the percentage of the human body
visible inside the bounding box. This allows computer vision models to be
evaluated on their detection performance across different ranges of occlusion.
NOMAD is designed to improve the effectiveness of aerial search and rescue and
to enhance collaboration between sUAS and humans, by providing a new benchmark
dataset for human detection under occluded aerial views.
- Abstract(参考訳): 捜索や救助などの緊急対応シナリオに対する小型無人航空機システム(suas)への依存が高まる中、コンピュータビジョン機能の統合はミッション成功の重要な要因となっている。
それでも、人間を検知するコンピュータビジョン性能は、地上から空中への視界シフト時に著しく低下する。
この問題を軽減するためにいくつかの航空データセットが作成されているが、緊急対応シナリオにおける重要な要素である閉塞の問題に特に対処する者はいない。
NOMAD(Natural Occluded Multi-scale Aerial Dataset)は、5つの異なる空中距離とリッチな画像のばらつきを持つ、閉鎖された空中ビュー下での人間の検出のためのベンチマークを示す。
ノマドは100の異なる俳優で構成され、それぞれが歩き、横たわり、隠れている。
5.4k解像度ビデオから抽出された42,825フレームを含み、バウンディングボックスと10の異なる可視性レベルを示すラベルを手作業で注釈付けし、バウンディングボックス内で見える人体の割合に応じて分類する。
これにより、コンピュータビジョンモデルが様々な咬合範囲で検出性能を評価することができる。
NOMADは、空中視下での人間の検出のための新しいベンチマークデータセットを提供することで、航空捜索と救助の有効性を改善し、sUASと人間との協力を強化するように設計されている。
関連論文リスト
- Psych-Occlusion: Using Visual Psychophysics for Aerial Detection of Occluded Persons during Search and Rescue [41.03292974500013]
スモール・アンマンド・エアリアル・システムズ (SUAS) は、緊急対応 (ER) のシナリオにおいて「空の目」として機能する。
空中からの人物の効率的な検出は ミッションの成果を達成する上で 重要な役割を担います
sUAS搭載のコンピュータビジョン(CV)モデルの性能は、実生活の厳密な条件下で著しく低下する。
我々は、その人間の精度データを用いて、行動データセットであるサイコERの使用を例示し、検出モデルの損失関数を適応させる。
論文 参考訳(メタデータ) (2024-12-07T06:22:42Z) - MMAUD: A Comprehensive Multi-Modal Anti-UAV Dataset for Modern Miniature
Drone Threats [37.981623262267036]
MMAUDは、ドローン検出、UAV型分類、軌道推定に焦点を当てて、現代の脅威検出手法における重要なギャップに対処する。
これは、熱とRGBを使用して特定のベタージュポイントでキャプチャされたデータセットよりも忠実度の高い実世界のシナリオに対処するための、ユニークな頭上の空中検出を提供する。
提案するモダリティは費用対効果が高く適応性が高いため,UAV脅威検出ツールの実験と実装が可能である。
論文 参考訳(メタデータ) (2024-02-06T04:57:07Z) - Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve
Aerial Visual Perception? [57.77643186237265]
我々は、異なる視点から同期シーンを記録するビデオデータセットであるMultiview Aerial Visual RECgnition(MAVREC)を提示する。
MAVRECは約2.5時間、業界標準の2.7K解像度ビデオシーケンス、0.5万フレーム以上のフレーム、11万の注釈付きバウンディングボックスで構成されている。
これにより、MAVRECは地上および空中ビューのデータセットとして最大であり、ドローンベースのデータセットの中では4番目に大きい。
論文 参考訳(メタデータ) (2023-12-07T18:59:14Z) - The State of Aerial Surveillance: A Survey [62.198765910573556]
本稿では、コンピュータビジョンとパターン認識の観点から、人間中心の空中監視タスクの概要を概観する。
主な対象は、単体または複数の被験者が検出され、特定され、追跡され、再同定され、その振る舞いが分析される人間である。
論文 参考訳(メタデータ) (2022-01-09T20:13:27Z) - Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。
本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。
本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-11-17T21:48:31Z) - Small or Far Away? Exploiting Deep Super-Resolution and Altitude Data
for Aerial Animal Surveillance [3.8015092217142223]
本研究では,全体的注目ネットワークに基づく超解像手法と,カスタム構築された高度データ利用ネットワークにより,実環境における検出の有効性が向上することを示す。
SAVMAP と AED の2つの大型航空捕獲動物データセットを用いて,本システムの評価を行った。
論文 参考訳(メタデータ) (2021-11-12T17:30:55Z) - A Multi-viewpoint Outdoor Dataset for Human Action Recognition [3.522154868524807]
我々は,YouTubeと当社のドローンから収集した多視点屋外行動認識データセットを提案する。
データセットは、20の動的なヒューマンアクションクラス、2324のビデオクリップ、503086フレームで構成されている。
全体のベースライン動作認識精度は74.0%である。
論文 参考訳(メタデータ) (2021-10-07T14:50:43Z) - UAV-Human: A Large Benchmark for Human Behavior Understanding with
Unmanned Aerial Vehicles [12.210724541266183]
UAVを用いた人間の行動理解のための新しいベンチマークUAVHumanを提案する。
本データセットは,67,428件のマルチモーダルビデオシーケンスと119件のアクション認識対象を含む。
フラットRGB映像による学習変換により,魚眼映像の歪みを緩和する魚眼行動認識手法を提案する。
論文 参考訳(メタデータ) (2021-04-02T08:54:04Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - A Flow Base Bi-path Network for Cross-scene Video Crowd Understanding in
Aerial View [93.23947591795897]
本稿では,これらの課題に対処し,ドローンから収集した視覚的データから参加者を自動的に理解する。
クロスシーンテストで発生する背景雑音を軽減するために, 二重ストリーム群カウントモデルを提案する。
極暗環境下での集団密度推定問題に対処するために,ゲームグランドセフトオートV(GTAV)によって生成された合成データを導入する。
論文 参考訳(メタデータ) (2020-09-29T01:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。