論文の概要: IndraEye: Infrared Electro-Optical UAV-based Perception Dataset for Robust Downstream Tasks
- arxiv url: http://arxiv.org/abs/2410.20953v1
- Date: Mon, 28 Oct 2024 12:12:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:22:21.714272
- Title: IndraEye: Infrared Electro-Optical UAV-based Perception Dataset for Robust Downstream Tasks
- Title(参考訳): IndraEye:ロバスト下流タスクのための赤外線電気光学UAVを用いた知覚データセット
- Authors: Manjunath D, Prajwal Gurunath, Sumanth Udupa, Aditya Gandhamal, Shrikar Madhu, Aniruddh Sikdar, Suresh Sundaram,
- Abstract要約: 本稿では,各種タスク用に設計されたマルチセンサ(EO-IR)データセットであるIndraEyeデータセットを紹介する。
画像は5,612枚と145,666枚で、複数の視角、高度、7つの背景、インド亜大陸を横断する異なる時間を含む。
このデータセットは、マルチモーダル学習、オブジェクトの検出とセグメンテーションのためのドメイン適応、センサー固有の強度と弱点の探索など、いくつかの研究機会を開く。
- 参考スコア(独自算出の注目度): 1.629670808239867
- License:
- Abstract: Deep neural networks (DNNs) have shown exceptional performance when trained on well-illuminated images captured by Electro-Optical (EO) cameras, which provide rich texture details. However, in critical applications like aerial perception, it is essential for DNNs to maintain consistent reliability across all conditions, including low-light scenarios where EO cameras often struggle to capture sufficient detail. Additionally, UAV-based aerial object detection faces significant challenges due to scale variability from varying altitudes and slant angles, adding another layer of complexity. Existing methods typically address only illumination changes or style variations as domain shifts, but in aerial perception, correlation shifts also impact DNN performance. In this paper, we introduce the IndraEye dataset, a multi-sensor (EO-IR) dataset designed for various tasks. It includes 5,612 images with 145,666 instances, encompassing multiple viewing angles, altitudes, seven backgrounds, and different times of the day across the Indian subcontinent. The dataset opens up several research opportunities, such as multimodal learning, domain adaptation for object detection and segmentation, and exploration of sensor-specific strengths and weaknesses. IndraEye aims to advance the field by supporting the development of more robust and accurate aerial perception systems, particularly in challenging conditions. IndraEye dataset is benchmarked with object detection and semantic segmentation tasks. Dataset and source codes are available at https://bit.ly/indraeye.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)は、エレクトロオプティカル・オプティカル(EO)カメラが捉えたよく照らされた画像でトレーニングされた際、優れたパフォーマンスを示し、テクスチャの詳細を提供する。
しかしながら、空中認識のような重要な応用においては、EOカメラが十分な詳細を捉えるのに苦労する低照度シナリオなど、DNNがすべての条件で一貫した信頼性を維持することが不可欠である。
さらに、UAVをベースとした空中物体検出は、様々な高度と傾斜角からのスケールのばらつきによって大きな課題に直面しており、別の複雑な層が加えられている。
既存の手法は、領域シフトとして照明の変化やスタイルの変化にのみ対処するが、空中認識では相関シフトもDNNのパフォーマンスに影響を及ぼす。
本稿では,各種タスク用に設計されたマルチセンサ(EO-IR)データセットであるIndraEyeデータセットを紹介する。
画像は5,612枚と145,666枚で、複数の視角、高度、7つの背景、インド亜大陸を横断する異なる時間を含む。
このデータセットは、マルチモーダル学習、オブジェクトの検出とセグメンテーションのためのドメイン適応、センサー固有の強度と弱点の探索など、いくつかの研究機会を開く。
IndraEyeは、特に困難な状況下で、より堅牢で正確な空中認識システムの開発を支援することで、分野を前進させることを目指している。
IndraEyeデータセットは、オブジェクト検出とセマンティックセグメンテーションタスクでベンチマークされる。
データセットとソースコードはhttps://bit.ly/indraeye.comで入手できる。
関連論文リスト
- FlightScope: A Deep Comprehensive Review of Aircraft Detection Algorithms in Satellite Imagery [2.9687381456164004]
本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。
この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。
YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文 参考訳(メタデータ) (2024-04-03T17:24:27Z) - Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve
Aerial Visual Perception? [57.77643186237265]
我々は、異なる視点から同期シーンを記録するビデオデータセットであるMultiview Aerial Visual RECgnition(MAVREC)を提示する。
MAVRECは約2.5時間、業界標準の2.7K解像度ビデオシーケンス、0.5万フレーム以上のフレーム、11万の注釈付きバウンディングボックスで構成されている。
これにより、MAVRECは地上および空中ビューのデータセットとして最大であり、ドローンベースのデータセットの中では4番目に大きい。
論文 参考訳(メタデータ) (2023-12-07T18:59:14Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - A benchmark dataset for deep learning-based airplane detection: HRPlanes [3.5297361401370044]
Google Earth(GE)の画像を用いて,高分解能平面(HRPlanes)と呼ばれる新しい航空機検出データセットを作成する。
HRPlanは、様々な衛星から得られた様々な地形、季節、衛星の幾何学的条件を表すために、世界中の様々な空港のGE画像を含む。
予備的な結果から,提案したデータセットは将来のアプリケーションに有用なデータソースとベンチマークデータセットとなる可能性が示唆された。
論文 参考訳(メタデータ) (2022-04-22T23:49:44Z) - Object Detection in Aerial Images: What Improves the Accuracy? [9.857292888257144]
空中画像における物体検出問題に対して,ディープラーニングに基づく物体検出手法が積極的に研究されている。
本研究では,空中物体検出におけるFaster R-CNNの影響について検討し,航空画像の性能向上のための数多くの戦略を探求する。
論文 参考訳(メタデータ) (2022-01-21T16:22:48Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - TJU-DHD: A Diverse High-Resolution Dataset for Object Detection [48.94731638729273]
大規模でリッチな多様性と高解像度のデータセットは、よりよいオブジェクト検出方法を開発する上で重要な役割を果たす。
私たちは多種多様な高解像度データセット(TJU-DHD)を構築します。
データセットには115,354枚の高解像度画像と709,330個のラベル付きオブジェクトが含まれており、スケールと外観に大きな違いがある。
論文 参考訳(メタデータ) (2020-11-18T09:32:24Z) - Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。
最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。
本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-16T12:36:23Z) - Perceiving Traffic from Aerial Images [86.994032967469]
本研究では,空中画像中の物体を検出するために,バタフライ検出器と呼ばれる物体検出手法を提案する。
UAVDT(UAVDT)とVisDrone 2019(VisDrone 2019)の2つのUAVデータセット上でButterfly Detectorを評価し、従来の最先端の手法よりも高速に動作し、かつリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-09-16T11:37:43Z) - EAGLE: Large-scale Vehicle Detection Dataset in Real-World Scenarios
using Aerial Imagery [3.8902657229395894]
航空画像における物体方向情報を用いた多種多様な車両検出のための大規模データセットを提案する。
様々なカメラセンサー、解像度、飛行高度、天候、照明、ヘイズ、シャドウ、時間、都市、国、オクルージョン、カメラアングルを備えた、さまざまな現実世界の状況からなる高解像度の空中画像が特徴である。
215,986のインスタンスに4つのポイントと向きで定義された向き付きバウンディングボックスがアノテートされており、このタスクでこれまでで最大のデータセットとなっている。
また、ヘイズやシャドウ除去の研究や、超高解像度やインペイントの応用も支援している。
論文 参考訳(メタデータ) (2020-07-12T23:00:30Z) - AU-AIR: A Multi-modal Unmanned Aerial Vehicle Dataset for Low Altitude
Traffic Surveillance [20.318367304051176]
カメラを搭載した無人航空機(UAV)は、空中(バードビュー)画像を撮影する利点がある。
オブジェクトアノテーションによる視覚データを含む、いくつかの空中データセットが導入されている。
本研究では,実環境下で収集されたマルチモーダルセンサデータを有する多目的航空データセット(AU-AIR)を提案する。
論文 参考訳(メタデータ) (2020-01-31T09:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。