論文の概要: Towards Large-Scale Small Object Detection: Survey and Benchmarks
- arxiv url: http://arxiv.org/abs/2207.14096v2
- Date: Sun, 31 Jul 2022 08:33:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 11:04:38.160615
- Title: Towards Large-Scale Small Object Detection: Survey and Benchmarks
- Title(参考訳): 大規模小型物体検出に向けて:調査とベンチマーク
- Authors: Gong Cheng, Xiang Yuan, Xiwen Yao, Kebing Yan, Qinghua Zeng, and
Junwei Han
- Abstract要約: 我々は2つの大規模小型物体検出装置(SODA)、SODA-DおよびSODA-Aを構築し、それぞれが運転シナリオと航空シナリオに焦点を当てている。
SODA-Aでは,高分解能空中画像2510点を抽出し,9クラスに800203点のアノテートを行う。
提案されたデータセットは、徹底的な注釈付きインスタンスの膨大なコレクションを持つ大規模なベンチマークへの最初の試みである。
- 参考スコア(独自算出の注目度): 51.41640059341532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of deep convolutional neural networks, object detection has
achieved prominent advances in past years. However, such prosperity could not
camouflage the unsatisfactory situation of Small Object Detection (SOD), one of
the notoriously challenging tasks in computer vision, owing to the poor visual
appearance and noisy representation caused by the intrinsic structure of small
targets. In addition, large-scale dataset for benchmarking small object
detection methods remains a bottleneck. In this paper, we first conduct a
thorough review of small object detection. Then, to catalyze the development of
SOD, we construct two large-scale Small Object Detection dAtasets (SODA),
SODA-D and SODA-A, which focus on the Driving and Aerial scenarios
respectively. SODA-D includes 24704 high-quality traffic images and 277596
instances of 9 categories. For SODA-A, we harvest 2510 high-resolution aerial
images and annotate 800203 instances over 9 classes. The proposed datasets, as
we know, are the first-ever attempt to large-scale benchmarks with a vast
collection of exhaustively annotated instances tailored for multi-category SOD.
Finally, we evaluate the performance of mainstream methods on SODA. We expect
the released benchmarks could facilitate the development of SOD and spawn more
breakthroughs in this field. Datasets and codes will be available soon at:
\url{https://shaunyuan22.github.io/SODA}.
- Abstract(参考訳): 深層畳み込みニューラルネットワークの台頭により、物体検出はここ数年で顕著な進歩を遂げている。
しかし、そのような繁栄は、小さな目標の本質的な構造によって引き起こされる視覚的外観やノイズの表現のために、コンピュータビジョンにおける非常に困難なタスクの1つである小対象検出(SOD)の不満足な状況に火をつけることができなかった。
さらに、小さなオブジェクト検出メソッドをベンチマークするための大規模なデータセットもボトルネックのままである。
本稿では,まず,小物体検出の徹底的な検討を行う。
次に,SOOD の開発を触媒として,運転シナリオと航空シナリオに焦点を当てた2つの大規模小型物体検出 dAtasets (SODA), SODA-D, SODA-A を構築した。
SODA-Dには、24704の高品質なトラフィックイメージと、9つのカテゴリの277596インスタンスが含まれている。
SODA-Aでは,高分解能空中画像2510点を抽出し,9クラスに800203点のアノテートを行う。
提案されたデータセットは、私たちが知っているように、マルチカテゴリのSOD用に調整された、広範囲に注釈付きインスタンスのコレクションを持つ大規模なベンチマークを最初に試みる試みである。
最後に,SODAにおける主流手法の性能を評価する。
リリースされているベンチマークによってsodの開発が促進され、この分野でさらなるブレークスルーが生まれると期待しています。
データセットとコードは、次のようになる。 \url{https://shaunyuan22.github.io/SODA}。
関連論文リスト
- Improving the Detection of Small Oriented Objects in Aerial Images [0.0]
本研究では,オブジェクト指向物体検出モデルの分類・回帰タスクを強化することにより,空中画像中の小型物体を高精度に検出する手法を提案する。
ガイド・アテンション・ロス(GALoss)とボックス・ポイント・ロス(BPLoss)の2つの損失からなるアテンション・ポイント・ネットワークを設計した。
実験結果から,小型オブジェクトインスタンスを用いた標準指向型空中データセットにおける注意点ネットワークの有効性が示された。
論文 参考訳(メタデータ) (2024-01-12T11:00:07Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Long Range Object-Level Monocular Depth Estimation for UAVs [0.0]
本稿では,画像からモノクロ物体を長距離検出するための最先端手法の新たな拡張法を提案する。
まず、回帰タスクとして深度推定をモデル化する際、SigmoidおよびReLUライクエンコーディングを提案する。
次に,深度推定を分類問題とし,訓練損失の計算にソフトアルグマックス関数を導入する。
論文 参考訳(メタデータ) (2023-02-17T15:26:04Z) - Detecting tiny objects in aerial images: A normalized Wasserstein
distance and a new benchmark [45.10513110142015]
本稿では, 正規化ワッサースタイン距離 (NWD) と呼ばれる新しい評価基準と, 小型物体検出のためのRanKing-based Assigning (RKA) 戦略を提案する。
提案したNWD-RKA戦略は、標準のIoUしきい値に基づくものを置き換えるために、あらゆる種類のアンカーベースの検出器に容易に組み込むことができる。
4つのデータセットでテストされたNWD-RKAは、大きなマージンで小さなオブジェクト検出性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-06-28T13:33:06Z) - A Survey of Deep Learning for Low-Shot Object Detection [44.20187548691372]
Low-Shot Object Detection (LSOD)は、アノテーション付きのサンプルからオブジェクトを検出する新しい研究トピックである。
本調査ではLSOD法について概観する。
論文 参考訳(メタデータ) (2021-12-06T06:56:00Z) - Object Detection in Aerial Images: A Large-Scale Benchmark and
Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。
提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。
70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文 参考訳(メタデータ) (2021-02-24T11:20:55Z) - SCRDet++: Detecting Small, Cluttered and Rotated Objects via
Instance-Level Feature Denoising and Rotation Loss Smoothing [131.04304632759033]
小さくて散らばった物体は実世界では一般的であり、検出は困難である。
本稿では,まず,物体検出にデノナイズするアイデアを革新的に紹介する。
機能マップ上のインスタンスレベルの記述は、小さくて散らばったオブジェクトの検出を強化するために行われる。
論文 参考訳(メタデータ) (2020-04-28T06:03:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。