Fugu-MT 論文翻訳(概要): Object Detection in Aerial Images: What Improves the Accuracy?

論文の概要: Object Detection in Aerial Images: What Improves the Accuracy?

arxiv url: http://arxiv.org/abs/2201.08763v1
Date: Fri, 21 Jan 2022 16:22:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-01-24 13:05:55.054039
Title: Object Detection in Aerial Images: What Improves the Accuracy?
Title（参考訳）: 空中画像における物体検出:精度が向上する理由
Authors: Hashmat Shadab Malik, Ikboljon Sobirov, and Abdelrahman Mohamed
Abstract要約: 空中画像における物体検出問題に対して,ディープラーニングに基づく物体検出手法が積極的に研究されている。本研究では,空中物体検出におけるFaster R-CNNの影響について検討し,航空画像の性能向上のための数多くの戦略を探求する。
参考スコア（独自算出の注目度）: 9.857292888257144
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Object detection is a challenging and popular computer vision problem. The problem is even more challenging in aerial images due to significant variation in scale and viewpoint in a diverse set of object categories. Recently, deep learning-based object detection approaches have been actively explored for the problem of object detection in aerial images. In this work, we investigate the impact of Faster R-CNN for aerial object detection and explore numerous strategies to improve its performance for aerial images. We conduct extensive experiments on the challenging iSAID dataset. The resulting adapted Faster R-CNN obtains a significant mAP gain of 4.96% over its vanilla baseline counterpart on the iSAID validation set, demonstrating the impact of different strategies investigated in this work.
Abstract（参考訳）: 物体検出は困難で一般的なコンピュータビジョン問題である。この問題は、様々な対象カテゴリーにおけるスケールと視点の著しい変化により、空中画像においてさらに困難である。近年,空中画像における物体検出問題に対して,ディープラーニングに基づく物体検出手法が積極的に研究されている。本研究では,空中物体検出における高速r-cnnの効果を調査し,その性能向上のための多数の戦略を検討する。挑戦的なiSAIDデータセットについて広範な実験を行った。その結果得られたFaster R-CNNは、iSAID検証セット上のバニラベースラインよりも4.96%大きなmAPゲインを得、この研究で調査された様々な戦略の影響を実証した。

関連論文リスト

FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection [21.38164867490915]
そこで本研究では,FBRT-YOLOと呼ばれる空中画像検出用リアルタイム検出器のファミリーを提案し,検出精度と効率の相違に対処する。 FCMは、ディープネットワークにおける小さなターゲット情報の損失に起因する情報不均衡の問題を軽減することに焦点を当てている。 MKPは異なる大きさのカーネルとの畳み込みを利用して、様々なスケールのターゲット間の関係を強化する。
論文参考訳（メタデータ） (2025-04-29T11:53:54Z)
Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文参考訳（メタデータ） (2024-12-16T09:14:32Z)
Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文参考訳（メタデータ） (2024-10-08T00:25:33Z)
FlightScope: A Deep Comprehensive Review of Aircraft Detection Algorithms in Satellite Imagery [2.9687381456164004]
本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。 YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文参考訳（メタデータ） (2024-04-03T17:24:27Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
On the Robustness of Object Detection Models in Aerial Images [37.50307094643692]
DOTA-v1.0に基づく新しいベンチマークを2つ導入する。第1のベンチマークは、19の一般的な汚職を含むが、第2のベンチマークは、クラウド崩壊したイメージに焦点を当てている。改良されたモデルアーキテクチャ,大規模ネットワーク,高度に構築されたモジュール,および巧妙なデータ拡張戦略により,航空物体検出モデルの堅牢性が向上することがわかった。
論文参考訳（メタデータ） (2023-08-29T15:16:51Z)
Aerial Image Object Detection With Vision Transformer Detector (ViTDet) [0.0]
Vision Transformer Detector (ViTDet) はオブジェクト検出のためのマルチスケール特徴を抽出するために提案されている。 ViTDetのシンプルな設計は、自然のシーン画像に優れた性能を実現し、どんな検出器アーキテクチャにも簡単に組み込むことができる。以上の結果から,VTDetは水平バウンディングボックス(HBB)オブジェクト検出において,畳み込みニューラルネットワークよりも一貫して優れていることがわかった。
論文参考訳（メタデータ） (2023-01-28T02:25:30Z)
Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。 OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文参考訳（メタデータ） (2022-12-26T12:49:47Z)
Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文参考訳（メタデータ） (2022-07-13T13:59:59Z)
Investigating the Challenges of Class Imbalance and Scale Variation in Object Detection in Aerial Images [0.0]
オブジェクトのスケールや向きの多様性は、識別を困難にします。本稿では,Faster-RCNNアーキテクチャに対するいくつかの変更を提案する。提案手法はベースラインよりも4.7mAPの精度向上を実現している。
論文参考訳（メタデータ） (2022-02-05T04:48:33Z)
AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文参考訳（メタデータ） (2021-06-19T03:30:22Z)
Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。 70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文参考訳（メタデータ） (2021-02-24T11:20:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。