論文の概要: Purifying, Labeling, and Utilizing: A High-Quality Pipeline for Small Object Detection
- arxiv url: http://arxiv.org/abs/2504.20602v1
- Date: Tue, 29 Apr 2025 10:11:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.840697
- Title: Purifying, Labeling, and Utilizing: A High-Quality Pipeline for Small Object Detection
- Title(参考訳): 清浄・ラベリング・利用:小型物体検出のための高品質パイプライン
- Authors: Siwei Wang, Zhiwei Chen, Liujuan Cao, Rongrong Ji,
- Abstract要約: PLUSNetは高品質のSmallオブジェクト検出フレームワークである。
上流の特徴を浄化するための階層的特徴(HFP)フレームワーク、中流トレーニングサンプルの品質を改善するための多重基準ラベル割り当て(MCLA)、下流タスクを達成するためにより効果的に情報を活用するための周波数分離ヘッド(FDHead)の3つのコンポーネントで構成されている。
- 参考スコア(独自算出の注目度): 83.90563802153707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Small object detection is a broadly investigated research task and is commonly conceptualized as a "pipeline-style" engineering process. In the upstream, images serve as raw materials for processing in the detection pipeline, where pre-trained models are employed to generate initial feature maps. In the midstream, an assigner selects training positive and negative samples. Subsequently, these samples and features are fed into the downstream for classification and regression. Previous small object detection methods often focused on improving isolated stages of the pipeline, thereby neglecting holistic optimization and consequently constraining overall performance gains. To address this issue, we have optimized three key aspects, namely Purifying, Labeling, and Utilizing, in this pipeline, proposing a high-quality Small object detection framework termed PLUSNet. Specifically, PLUSNet comprises three sequential components: the Hierarchical Feature Purifier (HFP) for purifying upstream features, the Multiple Criteria Label Assignment (MCLA) for improving the quality of midstream training samples, and the Frequency Decoupled Head (FDHead) for more effectively exploiting information to accomplish downstream tasks. The proposed PLUS modules are readily integrable into various object detectors, thus enhancing their detection capabilities in multi-scale scenarios. Extensive experiments demonstrate the proposed PLUSNet consistently achieves significant and consistent improvements across multiple datasets for small object detection.
- Abstract(参考訳): 小型物体検出は、広く研究されている研究課題であり、一般に「ピペリンスタイル」エンジニアリングプロセスとして概念化されている。
上流では、画像は検出パイプラインで処理する原料として機能し、事前訓練されたモデルを用いて初期特徴マップを生成する。
中間ストリームでは、アサインダは、正および負のサンプルのトレーニングを選択する。
その後、これらのサンプルと特徴は、分類と回帰のために下流に供給される。
以前の小さなオブジェクト検出手法では、パイプラインの分離ステージの改善に重点を置いていたため、全体的な最適化を無視し、全体的なパフォーマンス向上を制限していた。
この問題に対処するため、パイプラインでPurifying、Labeling、Utilizingという3つの重要な側面を最適化し、PLUSNetと呼ばれる高品質なSmallオブジェクト検出フレームワークを提案しました。
具体的には、上流の特徴を浄化するための階層的特徴浄化器(HFP)、中流トレーニングサンプルの品質を改善するための多重基準ラベル割り当て(MCLA)、下流タスクをより効果的に活用するための周波数デカップリングヘッド(FDHead)の3つのシーケンシャルコンポーネントから構成される。
提案したPLUSモジュールは様々な物体検出器に容易に統合可能であり、マルチスケールシナリオにおける検出能力を向上する。
大規模な実験では、提案されたPLUSNetが、小さなオブジェクト検出のために複数のデータセットにまたがる顕著で一貫した改善を一貫して達成している。
関連論文リスト
- CS-Net:Contribution-based Sampling Network for Point Cloud Simplification [50.55658910053004]
ポイントクラウドサンプリングは、様々なビジョンタスクの計算コストとストレージ要求を減らす上で重要な役割を果たす。
最遠点サンプリングのような従来のサンプリング手法では、タスク固有の情報が欠落している。
提案手法では, サンプル処理をTop-k操作として定式化したCS-Netを提案する。
論文 参考訳(メタデータ) (2025-01-18T14:56:09Z) - Multi-Point Positional Insertion Tuning for Small Object Detection [10.852047082856487]
小さなオブジェクト検出は、画像内の小さなオブジェクトをローカライズし、分類することを目的としている。
訓練済みのオブジェクト検出モデルを微調整することは、計算量とメモリコストがかかる。
本稿では,小物体検出のためのパラメータ効率微調整(PEFT)手法であるMPIチューニングを提案する。
論文 参考訳(メタデータ) (2024-12-24T02:04:47Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - Comprehensive Analysis of the Object Detection Pipeline on UAVs [16.071349046409885]
まず、リモートセンシングアプリケーションにおける7つのパラメータ(量子化、圧縮、解像度、色モデル、画像歪み、ガンマ補正、追加チャネル)の影響を実験的に分析する。
すべてのパラメータが検出精度とデータスループットに等しく影響を与えるわけではなく、パラメータ間の適切な妥協により、軽量物体検出モデルの検出精度を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-01T09:30:01Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。