論文の概要: Rethinking the backbone architecture for tiny object detection
- arxiv url: http://arxiv.org/abs/2303.11267v1
- Date: Mon, 20 Mar 2023 16:50:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 14:34:03.006354
- Title: Rethinking the backbone architecture for tiny object detection
- Title(参考訳): 小型物体検出のためのバックボーンアーキテクチャ再考
- Authors: Jinlai Ning, Haoyan Guan, Michael Spratling
- Abstract要約: 既存の小さなオブジェクト検出方法は、標準的なディープニューラルネットワークをバックボーンアーキテクチャとして使用しています。
このようなバックボーンは、大きなオブジェクトの分類のために設計されたため、小さなオブジェクトを検出するには不適切であり、小さなターゲットを特定するための空間分解能を持っていない、と我々は主張する。
我々は、全体的な計算負荷を伴わずに、高解像度の機能を処理するためにより多くのリソースを割り当てる「ボトムヘビー」バージョンのバックボーンを設計する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tiny object detection has become an active area of research because images
with tiny targets are common in several important real-world scenarios.
However, existing tiny object detection methods use standard deep neural
networks as their backbone architecture. We argue that such backbones are
inappropriate for detecting tiny objects as they are designed for the
classification of larger objects, and do not have the spatial resolution to
identify small targets. Specifically, such backbones use max-pooling or a large
stride at early stages in the architecture. This produces lower resolution
feature-maps that can be efficiently processed by subsequent layers. However,
such low-resolution feature-maps do not contain information that can reliably
discriminate tiny objects. To solve this problem we design 'bottom-heavy'
versions of backbones that allocate more resources to processing
higher-resolution features without introducing any additional computational
burden overall. We also investigate if pre-training these backbones on images
of appropriate size, using CIFAR100 and ImageNet32, can further improve
performance on tiny object detection. Results on TinyPerson and WiderFace show
that detectors with our proposed backbones achieve better results than the
current state-of-the-art methods.
- Abstract(参考訳): いくつかの重要な現実のシナリオでは、小さなターゲットを持つ画像が一般的であるため、小さな物体検出が研究の活発な領域となっている。
しかし、既存の小さなオブジェクト検出手法では、バックボーンアーキテクチャとして標準的なディープニューラルネットワークを使用している。
このようなバックボーンは、大きな物体の分類のために設計されたため、小さな物体を検出するには不適切であり、小さな対象を特定するための空間分解能を持っていない。
具体的には、そのようなバックボーンはアーキテクチャの初期段階で最大プーリングまたは大きなストライドを使用する。
これにより低解像度のフィーチャーマップが生成され、その後のレイヤで効率的に処理できる。
しかし、そのような低解像度の特徴写像は、小さな物体を確実に識別できる情報を含まない。
この問題を解決するために、我々は高解像度の機能により多くのリソースを割り当てるバックボーンの「ボトムヘビー」バージョンを設計する。
また、CIFAR100とImageNet32を用いて、これらのバックボーンを適切な大きさの画像上で事前学習することで、小さな物体検出の性能をさらに向上できるかどうかについても検討する。
tinypersonとwidefaceの結果から,提案するバックボーンを持つ検出器は,現在の最先端手法よりも優れた結果が得られることがわかった。
関連論文リスト
- ESOD: Efficient Small Object Detection on High-Resolution Images [36.80623357577051]
小さなオブジェクトは通常、わずかに分散され、局所的にクラスタ化される。
画像の非対象背景領域において、大量の特徴抽出計算を無駄にする。
本稿では,検出器のバックボーンを再利用して,特徴レベルのオブジェクト探索とパッチスライシングを行う方法を提案する。
論文 参考訳(メタデータ) (2024-07-23T12:21:23Z) - Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - Improving the Detection of Small Oriented Objects in Aerial Images [0.0]
本研究では,オブジェクト指向物体検出モデルの分類・回帰タスクを強化することにより,空中画像中の小型物体を高精度に検出する手法を提案する。
ガイド・アテンション・ロス(GALoss)とボックス・ポイント・ロス(BPLoss)の2つの損失からなるアテンション・ポイント・ネットワークを設計した。
実験結果から,小型オブジェクトインスタンスを用いた標準指向型空中データセットにおける注意点ネットワークの有効性が示された。
論文 参考訳(メタデータ) (2024-01-12T11:00:07Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - Neural Architecture Adaptation for Object Detection by Searching Channel
Dimensions and Mapping Pre-trained Parameters [17.090405682103167]
ほとんどのオブジェクト検出フレームワークは、元来画像分類用に設計されたバックボーンアーキテクチャを使用する。
最近のニューラルアーキテクチャサーチ(NAS)研究は、オブジェクト検出に特化したバックボーンの自動設計が全体的な精度を向上させることを実証している。
本稿では,検出目的のために与えられたバックボーンを最適化するニューラルアーキテクチャ適応手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T02:01:56Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。