論文の概要: Generalized Small Object Detection:A Point-Prompted Paradigm and Benchmark
- arxiv url: http://arxiv.org/abs/2604.02773v1
- Date: Fri, 03 Apr 2026 06:32:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.350567
- Title: Generalized Small Object Detection:A Point-Prompted Paradigm and Benchmark
- Title(参考訳): 一般化された小物体検出:ポイントプロンプトパラダイムとベンチマーク
- Authors: Haoran Zhu, Wen Yang, Guangyou Yang, Chang Xu, Ruixiang Zhang, Fang Xu, Haijian Zhang, Gui-Song Xia,
- Abstract要約: 小さい物体検出(SOD)は、非常に限られたピクセルとあいまいな物体の境界のために難しいままである。
これらの特徴は、挑戦的なアノテーション、大規模な高品質データセットの可用性の制限、そして本質的に小さなオブジェクトに対する弱いセマンティック表現をもたらす。
本研究では,小型オブジェクト検出のための大規模マルチドメインデータセットTinySet-9Mを導入することで,データ制限に対処する。
- 参考スコア(独自算出の注目度): 54.91847070147244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Small object detection (SOD) remains challenging due to extremely limited pixels and ambiguous object boundaries. These characteristics lead to challenging annotation, limited availability of large-scale high-quality datasets, and inherently weak semantic representations for small objects. In this work, we first address the data limitation by introducing TinySet-9M, the first large-scale, multi-domain dataset for small object detection. Beyond filling the gap in large-scale datasets, we establish a benchmark to evaluate the effectiveness of existing label-efficient detection methods for small objects. Our evaluation reveals that weak visual cues further exacerbate the performance degradation of label-efficient methods in small object detection, highlighting a critical challenge in label-efficient SOD. Secondly, to tackle the limitation of insufficient semantic representation, we move beyond training-time feature enhancement and propose a new paradigm termed Point-Prompt Small Object Detection (P2SOD). This paradigm introduces sparse point prompts at inference time as an efficient information bridge for category-level localization, enabling semantic augmentation. Building upon the P2SOD paradigm and the large-scale TinySet-9M dataset, we further develop DEAL (DEtect Any smalL object), a scalable and transferable point-prompted detection framework that learns robust, prompt-conditioned representations from large-scale data. With only a single click at inference time, DEAL achieves a 31.4% relative improvement over fully supervised baselines under strict localization metrics (e.g., AP75) on TinySet-9M, while generalizing effectively to unseen categories and unseen datasets. Our project is available at https://zhuhaoraneis.github.io/TinySet-9M/.
- Abstract(参考訳): 小さい物体検出(SOD)は、非常に限られたピクセルとあいまいな物体の境界のために難しいままである。
これらの特徴は、挑戦的なアノテーション、大規模な高品質データセットの可用性の制限、そして本質的に小さなオブジェクトに対する弱いセマンティック表現をもたらす。
本研究では,小型オブジェクト検出のための大規模マルチドメインデータセットTinySet-9Mを導入することで,データ制限に対処する。
大規模データセットのギャップを埋めるだけでなく、我々は、小さなオブジェクトに対する既存のラベル効率検出手法の有効性を評価するためのベンチマークを構築した。
評価の結果,弱い視覚的手がかりは,小物体検出におけるラベル効率の高い手法の性能劣化をさらに悪化させ,ラベル効率のSODにおける重要な課題を浮き彫りにした。
第二に、セマンティック表現の限界に対処するため、訓練時機能拡張を超越し、P2SOD(Point-Prompt Small Object Detection)と呼ばれる新しいパラダイムを提案する。
このパラダイムは、カテゴリーレベルのローカライゼーションのための効率的な情報ブリッジとして、推論時にスパースポイントプロンプトを導入し、セマンティック拡張を可能にする。
P2SODパラダイムと大規模TinySet-9Mデータセットに基づいて、大規模データから堅牢で迅速な条件付き表現を学習するスケーラブルで転送可能なポイントプロンプト検出フレームワークであるDEAL(DEtect Any smalL object)をさらに発展させる。
推測時間のたった1クリックで、DeALはTinySet-9M上の厳密なローカライゼーションメトリクス(例えばAP75)の下で、完全な教師付きベースラインよりも31.4%の相対的な改善を実現した。
私たちのプロジェクトはhttps://zhuhaoraneis.github.io/TinySet-9M/で利用可能です。
関連論文リスト
- Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Similarity Distance-Based Label Assignment for Tiny Object Detection [17.059514012235354]
そこで我々は,SimD(Simisity Distance)と呼ばれるシンプルだが効果的な戦略を導入し,ボックス間の類似性を評価する。
我々のアプローチは、ラベル割り当てやNon Maximum Suppression(NMS)のためのIoUの代わりに、一般的なアンカーベース検出器に適用できる。
4つの主流となる小型物体検出データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-07-02T16:12:37Z) - Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。