論文の概要: Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning
- arxiv url: http://arxiv.org/abs/2308.09534v1
- Date: Fri, 18 Aug 2023 13:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 13:07:53.653693
- Title: Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning
- Title(参考訳): 粗大な提案生成と模倣学習による小物体検出
- Authors: Xiang Yuan, Gong Cheng, Kebing Yan, Qinghua Zeng, Junwei Han
- Abstract要約: 本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 52.06176253457522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The past few years have witnessed the immense success of object detection,
while current excellent detectors struggle on tackling size-limited instances.
Concretely, the well-known challenge of low overlaps between the priors and
object regions leads to a constrained sample pool for optimization, and the
paucity of discriminative information further aggravates the recognition. To
alleviate the aforementioned issues, we propose CFINet, a two-stage framework
tailored for small object detection based on the Coarse-to-fine pipeline and
Feature Imitation learning. Firstly, we introduce Coarse-to-fine RPN (CRPN) to
ensure sufficient and high-quality proposals for small objects through the
dynamic anchor selection strategy and cascade regression. Then, we equip the
conventional detection head with a Feature Imitation (FI) branch to facilitate
the region representations of size-limited instances that perplex the model in
an imitation manner. Moreover, an auxiliary imitation loss following supervised
contrastive learning paradigm is devised to optimize this branch. When
integrated with Faster RCNN, CFINet achieves state-of-the-art performance on
the large-scale small object detection benchmarks, SODA-D and SODA-A,
underscoring its superiority over baseline detector and other mainstream
detection approaches.
- Abstract(参考訳): 過去数年間、物体検出は大きな成功を収めてきたが、現在の優れた検出器はサイズ制限のインスタンスに取り組むのに苦労している。
具体的には、事前と対象領域の重なりの少ない既知の課題は最適化のための制約付きサンプルプールにつながり、識別情報のポーシティは認識をさらに悪化させる。
上記の問題を緩和するため,我々は,粗いパイプラインと特徴模倣学習に基づく小型物体検出のための2段階フレームワークであるcfinetを提案する。
まず,小型オブジェクトに対して,動的アンカー選択戦略とカスケード回帰により,十分かつ高品質な提案を実現するために,CRPN(Coarse-to-fine RPN)を導入する。
次に、従来の検出ヘッドに特徴模倣(fi)ブランチを装備し、モデルに模倣を施すサイズ制限されたインスタンスの領域表現を容易にする。
また,この分岐を最適化するために,教師付きコントラスト学習パラダイムに続く補助的模倣損失が考案された。
Faster RCNNと統合すると、CFINetは大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端のパフォーマンスを達成し、ベースライン検出器や他の主流検出アプローチよりも優れていることを裏付ける。
関連論文リスト
- Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - PETDet: Proposal Enhancement for Two-Stage Fine-Grained Object Detection [26.843891792018447]
PETDet (Proposal Enhancement for Two-stage fine-fine object detection) は, 2段階FGOD法において, サブタスクをよりよく扱うために提案される。
動的ラベル割り当てと注意に基づく分解により, アンカーフリー品質指向提案ネットワーク(QOPN)を提案する。
A novel Adaptive Recognition Loss (ARL)は、R-CNNの責任者が高品質な提案に焦点を合わせるためのガイダンスを提供する。
論文 参考訳(メタデータ) (2023-12-16T18:04:56Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。