論文の概要: Investigating the Challenges of Class Imbalance and Scale Variation in
Object Detection in Aerial Images
- arxiv url: http://arxiv.org/abs/2202.02489v1
- Date: Sat, 5 Feb 2022 04:48:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-13 14:36:35.246489
- Title: Investigating the Challenges of Class Imbalance and Scale Variation in
Object Detection in Aerial Images
- Title(参考訳): 空中画像における物体検出におけるクラス不均衡とスケール変動の課題の検討
- Authors: Ahmed Elhagry, Mohamed Saeed
- Abstract要約: オブジェクトのスケールや向きの多様性は、識別を困難にします。
本稿では,Faster-RCNNアーキテクチャに対するいくつかの変更を提案する。
提案手法はベースラインよりも4.7mAPの精度向上を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While object detection is a common problem in computer vision, it is even
more challenging when dealing with aerial satellite images. The variety in
object scales and orientations can make them difficult to identify. In
addition, there can be large amounts of densely packed small objects such as
cars. In this project, we propose a few changes to the Faster-RCNN
architecture. First, we experiment with different backbones to extract better
features. We also modify the data augmentations and generated anchor sizes for
region proposals in order to better handle small objects. Finally, we
investigate the effects of different loss functions. Our proposed design
achieves an improvement of 4.7 mAP over the baseline which used a vanilla
Faster R-CNN with a ResNet-101 FPN backbone.
- Abstract(参考訳): 物体検出はコンピュータビジョンでは一般的な問題であるが、航空衛星画像を扱う場合にはさらに困難である。
オブジェクトのスケールや向きの多様性は、識別を困難にします。
さらに、自動車のような密集した小さな物体も大量に存在する。
本稿では,Faster-RCNNアーキテクチャに対するいくつかの変更を提案する。
まず、より良い特徴を抽出するために異なるバックボーンを実験する。
また、小さなオブジェクトをよりうまく扱うために、データ拡張や領域提案のためのアンカーサイズも変更しました。
最後に、異なる損失関数の効果について検討する。
提案設計では,ResNet-101 FPNバックボーン付きバニラファストR-CNNを用いたベースラインの4.7mAPの改善を実現している。
関連論文リスト
- Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Transformation-Invariant Network for Few-Shot Object Detection in Remote
Sensing Images [15.251042369061024]
FSOD(Few-shot Object Detection)は、トレーニングのために大量のラベル付きデータを頼りにしている。
リモートセンシング画像におけるオブジェクトのスケールと向きのバリエーションは、既存のFSOD法に重大な課題をもたらす。
特徴ピラミッドネットワークの統合と,クエリ機能向上のためのプロトタイプ機能の利用を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:21:38Z) - ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object
Detection [24.085715205081385]
我々は、オブジェクトのサイズを画像中の画素数、サイズ不均衡として、データセット内の特定のサイズのオブジェクトの過剰表現として表現する。
本稿では,任意のオブジェクト検出モデル上にプラグインとして適用可能な,新しいARchitectUre-Agnostic BAlanced Loss (ARUBA)を提案する。
論文 参考訳(メタデータ) (2022-10-10T11:28:16Z) - Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - Object Detection in Aerial Images: What Improves the Accuracy? [9.857292888257144]
空中画像における物体検出問題に対して,ディープラーニングに基づく物体検出手法が積極的に研究されている。
本研究では,空中物体検出におけるFaster R-CNNの影響について検討し,航空画像の性能向上のための数多くの戦略を探求する。
論文 参考訳(メタデータ) (2022-01-21T16:22:48Z) - Concurrent Segmentation and Object Detection CNNs for Aircraft Detection
and Identification in Satellite Images [0.0]
本稿では,2つの全く異なる畳み込みニューラルネットワーク(CNN)を組み合わせて航空機を検出・識別する専用手法を提案する。
その結果, この組み合わせは各ユニタリモデルよりも有意に優れ, 偽陰性率を大幅に低下させることがわかった。
論文 参考訳(メタデータ) (2020-05-27T07:35:55Z) - SCRDet++: Detecting Small, Cluttered and Rotated Objects via
Instance-Level Feature Denoising and Rotation Loss Smoothing [131.04304632759033]
小さくて散らばった物体は実世界では一般的であり、検出は困難である。
本稿では,まず,物体検出にデノナイズするアイデアを革新的に紹介する。
機能マップ上のインスタンスレベルの記述は、小さくて散らばったオブジェクトの検出を強化するために行われる。
論文 参考訳(メタデータ) (2020-04-28T06:03:54Z) - PENet: Object Detection using Points Estimation in Aerial Images [9.33900415971554]
これらの課題に対処するために,新しいネットワーク構造であるポイント推定ネットワーク(PENet)を提案する。
PENetはMask Resampling Module(MRM)を使用して、不均衡なデータセットを増大させ、粗いアンカーフリー検出器(CPEN)で小さなオブジェクトクラスタの中心点を効果的に予測し、微細なアンカーフリー検出器FPENで小さなオブジェクトの正確な位置を特定する。
航空データセット visDrone と UAVDT による実験により,PENet は既存の最先端手法よりも精度の高い結果を得た。
論文 参考訳(メタデータ) (2020-01-22T19:43:17Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。