論文の概要: Cascaded Zoom-in Detector for High Resolution Aerial Images
- arxiv url: http://arxiv.org/abs/2303.08747v1
- Date: Wed, 15 Mar 2023 16:39:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 12:52:46.739481
- Title: Cascaded Zoom-in Detector for High Resolution Aerial Images
- Title(参考訳): 高分解能空中画像用カスケードズームイン検出器
- Authors: Akhil Meethal, Eric Granger, Marco Pedersoli
- Abstract要約: 密度誘導型トレーニングと推論のために検出器自体を再利用した効率的なカスケードズームイン検出器を提案する。
トレーニング中、密度作物が配置され、新しいクラスとしてラベル付けされ、トレーニングデータセットの強化に使用される。
このアプローチはどんな検出器にも容易に統合でき、標準検出プロセスに大きな変化は生じない。
- 参考スコア(独自算出の注目度): 12.944309759825902
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Detecting objects in aerial images is challenging because they are typically
composed of crowded small objects distributed non-uniformly over
high-resolution images. Density cropping is a widely used method to improve
this small object detection where the crowded small object regions are
extracted and processed in high resolution. However, this is typically
accomplished by adding other learnable components, thus complicating the
training and inference over a standard detection process. In this paper, we
propose an efficient Cascaded Zoom-in (CZ) detector that re-purposes the
detector itself for density-guided training and inference. During training,
density crops are located, labeled as a new class, and employed to augment the
training dataset. During inference, the density crops are first detected along
with the base class objects, and then input for a second stage of inference.
This approach is easily integrated into any detector, and creates no
significant change in the standard detection process, like the uniform cropping
approach popular in aerial image detection. Experimental results on the aerial
images of the challenging VisDrone and DOTA datasets verify the benefits of the
proposed approach. The proposed CZ detector also provides state-of-the-art
results over uniform cropping and other density cropping methods on the
VisDrone dataset, increasing the detection mAP of small objects by more than 3
points.
- Abstract(参考訳): 空中画像中の物体を検出することは、通常、高解像度画像上に均一に分散された混み合った小さな物体からなるため、難しい。
密度クロッピングは、密集した小さな物体領域を高分解能で抽出処理するこの小さな物体検出を改善するために広く用いられる方法である。
しかし、これは通常、他の学習可能なコンポーネントを追加して行われ、標準検出プロセスよりもトレーニングと推論を複雑にする。
本稿では,密度誘導型学習と推論のために検出器自体を再利用する,効率的なカスケード型ズームイン検出器を提案する。
トレーニング中、密度作物が配置され、新しいクラスとしてラベル付けされ、トレーニングデータセットの強化に使用される。
推論中、密度作物はまず基底クラスオブジェクトとともに検出され、次に第2段階の推論のために入力される。
このアプローチはどんな検出器にも容易に統合でき、空中画像検出で一般的な一様収穫法のような標準検出プロセスに大きな変化は生じない。
VisDroneとDOTAデータセットの空中画像による実験結果から,提案手法の利点が検証された。
提案するcz検出器は、visdroneデータセット上の均一なクロッピングおよび他の密度クロッピング法に対する最先端の結果も提供し、小さなオブジェクトの検出マップを3ポイント以上増加させる。
関連論文リスト
- Remote Sensing Change Detection (Segmentation) using Denoising Diffusion
Probabilistic Models [54.1843419649895]
そこで本研究では,数百万枚もの市販の遠隔センシング画像をトレーニングプロセスに組み込む新しい手法を提案する。
まず、事前学習した拡散確率モデルを用いて、これらのオフザシェルフ、未修正、未ラベルのリモートセンシング画像からの情報を活用する。
4つの公開CDデータセットで実施された実験により、提案手法はF1, IoUの最先端手法と全体的な精度よりも驚くほど優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2022-06-23T17:58:29Z) - Knowledge Distillation for Oriented Object Detection on Aerial Images [1.827510863075184]
本稿では,KD-RNetの知識蒸留による空中画像の回転物体検出のためのモデル圧縮手法を提案する。
大規模空中物体検出データセット(DOTA)による実験結果から,提案したKD-RNetモデルにより,パラメータ数を削減した平均値精度(mAP)が向上し,同時にKD-RNetは,基底アノテーションと高い重なり合う高品質検出を提供することで,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T14:24:16Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Focus-and-Detect: A Small Object Detection Framework for Aerial Images [1.911678487931003]
我々はFocus-and-Detectと呼ばれる2段階のオブジェクト検出フレームワークを提案する。
第1段階は、焦点領域を構成するオブジェクトのクラスタを生成する。
第2段階は対象検出器ネットワークであり、焦点領域内の物体を予測する。
提案した2段階のフレームワークは,VisDrone検証データセットのAPスコアが42.06であることを示す。
論文 参考訳(メタデータ) (2022-03-24T10:43:56Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Robust Unsupervised Small Area Change Detection from SAR Imagery Using
Deep Learning [23.203687716051697]
合成開口レーダ(SAR)画像から小さな領域変化検出のための頑健な教師なし手法を提案する。
差分画像(DI)を生成するマルチスケールスーパーピクセル再構成法を開発した。
二段階中心拘束型ファジィc平均クラスタリングアルゴリズムを提案し、DIの画素を変化・変化・中間クラスに分割する。
論文 参考訳(メタデータ) (2020-11-22T12:50:08Z) - SWIPENET: Object detection in noisy underwater images [41.35601054297707]
本稿では,この2つの問題に対処するために,Sample-WeIghted hyPEr Network(SWIPENET)とCurriculum Multi-Class Adaboost(CMA)という堅牢なトレーニングパラダイムを提案する。
SWIPENETのバックボーンは、複数の高解像度かつセマンティックリッチなハイパーフィーチャーマップを生成し、小さなオブジェクト検出を大幅に改善する。
簡単な概念から難しい概念まで学習を促進する人間の教育プロセスに着想を得て,まず騒音の影響を受けないクリーンな検出器を訓練するCMA訓練パラダイムを提案する。
論文 参考訳(メタデータ) (2020-10-19T16:41:20Z) - Underwater object detection using Invert Multi-Class Adaboost with deep
learning [37.14538666012363]
小型物体検出のための新しいニューラルネットワークアーキテクチャであるSample-WeIghted hyPEr Network(SWIPENet)を提案する。
提案するSWIPENet+IMAフレームワークは,複数の最先端オブジェクト検出手法に対して,検出精度の向上を実現する。
論文 参考訳(メタデータ) (2020-05-23T15:30:38Z) - SCRDet++: Detecting Small, Cluttered and Rotated Objects via
Instance-Level Feature Denoising and Rotation Loss Smoothing [131.04304632759033]
小さくて散らばった物体は実世界では一般的であり、検出は困難である。
本稿では,まず,物体検出にデノナイズするアイデアを革新的に紹介する。
機能マップ上のインスタンスレベルの記述は、小さくて散らばったオブジェクトの検出を強化するために行われる。
論文 参考訳(メタデータ) (2020-04-28T06:03:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。