論文の概要: Generalized-Scale Object Counting with Gradual Query Aggregation
- arxiv url: http://arxiv.org/abs/2511.08048v1
- Date: Wed, 12 Nov 2025 01:36:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.613334
- Title: Generalized-Scale Object Counting with Gradual Query Aggregation
- Title(参考訳): Gradual Query Aggregation を用いた汎用オブジェクトカウント
- Authors: Jer Pelhan, Alan Lukezic, Matej Kristan,
- Abstract要約: GECO2は、オブジェクトスケールの問題に明示的に対処するエンドツーエンドのいくつかのショットカウントと検出方法である。
最新の数ショットカウンタを超え、GPUメモリのフットプリントを小さくして3倍高速に動作しながら、検出精度を10%向上する。
- 参考スコア(独自算出の注目度): 18.582729412306346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot detection-based counters estimate the number of instances in the image specified only by a few test-time exemplars. A common approach to localize objects across multiple sizes is to merge backbone features of different resolutions. Furthermore, to enable small object detection in densely populated regions, the input image is commonly upsampled and tiling is applied to cope with the increased computational and memory requirements. Because of these ad-hoc solutions, existing counters struggle with images containing diverse-sized objects and densely populated regions of small objects. We propose GECO2, an end-to-end few-shot counting and detection method that explicitly addresses the object scale issues. A new dense query representation gradually aggregates exemplar-specific feature information across scales that leads to high-resolution dense queries that enable detection of large as well as small objects. GECO2 surpasses state-of-the-art few-shot counters in counting as well as detection accuracy by 10% while running 3x times faster at smaller GPU memory footprint.
- Abstract(参考訳): 少ないショット検出ベースのカウンタは、少数のテストタイムの例によってのみ指定された画像内のインスタンス数を推定する。
複数のサイズのオブジェクトをローカライズする一般的なアプローチは、異なる解像度のバックボーン機能をマージすることだ。
さらに、人口密度の高い地域で小さな物体検出を可能にするため、入力画像のサンプリングが一般的であり、タイリングを適用して計算およびメモリ要求の増大に対処する。
これらのアドホックな解のため、既存のカウンタは、多様な大きさの物体と、小さな物体の密集した領域を含む画像に苦しむ。
本稿では,オブジェクトスケール問題に明示的に対処する,エンドツーエンドの複数ショットカウントと検出手法であるGECO2を提案する。
新しい高密度クエリ表現は、大規模かつ小さなオブジェクトの検出を可能にする高解像度の高密度クエリに繋がる、典型的な特徴情報を徐々に集約する。
GECO2は最新の数ショットカウンタを超え、GPUメモリのフットプリントを小さくして3倍高速に動作しながら、検出精度を10%向上させる。
関連論文リスト
- SparseFormer: Detecting Objects in HRW Shots via Sparse Vision Transformer [62.11796778482088]
本稿では,近接撮影とHRW撮影のオブジェクト検出のギャップを埋めるために,SparseFormerと呼ばれるモデル非依存のスパース視覚変換器を提案する。
提案されたSparseFormerは、オブジェクトを含む可能性のあるスパース分散ウィンドウを精査するために、注意トークンを選択的に使用する。
2つのHRWベンチマークであるPANDAとDOTA-v1.0の実験により、提案されたSparseFormerは、最先端のアプローチよりも検出精度(最大5.8%)と速度(最大3倍)を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-02-11T03:21:25Z) - YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.80392696735718]
YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。
大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。
Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文 参考訳(メタデータ) (2024-04-09T10:03:44Z) - SQLNet: Scale-Modulated Query and Localization Network for Few-Shot Class-Agnostic Counting [67.97870844244187]
CAC(class-agnostic counting)タスクは、最近、任意のクラスの全てのオブジェクトを、入力画像にいくつかの例を付与してカウントする問題を解くために提案されている。
我々は、スケール変調クエリーおよびローカライズネットワーク(Net)と呼ばれる、新しいローカライズベースのCACアプローチを提案する。
クエリとローカライゼーションの段階において、模範者のスケールを完全に探求し、各オブジェクトを正確に位置付けし、その近似サイズを予測することで、効果的なカウントを実現している。
論文 参考訳(メタデータ) (2023-11-16T16:50:56Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - A Coarse to Fine Framework for Object Detection in High Resolution Image [8.316322664637537]
オブジェクト検出の現在のアプローチでは、高解像度画像における小さなオブジェクトや大規模な分散問題を検出することはめったにない。
本稿では,オブジェクト検出の精度を,特に小さなオブジェクトや大規模分散シーンに対して向上させる,シンプルで効率的なアプローチを提案する。
提案手法は,高分解能画像における物体の空間と情報を有効利用することにより,より効率的に検出できる。
論文 参考訳(メタデータ) (2023-03-02T13:04:33Z) - One-Shot General Object Localization [43.88712478006662]
OneLocは一般的なワンショットオブジェクトローカライゼーションアルゴリズムである。
OneLocは、特別な投票方式により、オブジェクトセンターとバウンディングボックスサイズを効率的に見つける。
実験の結果,提案手法は2つのデータセットに対して,最先端の総合的な性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-11-24T03:14:04Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Localizing Grouped Instances for Efficient Detection in Low-Resource
Scenarios [27.920304852537534]
可変物体の大きさや密度に適応するフレキシブルな検出手法を提案する。
我々は検出段階の連続に頼り、それぞれが個人だけでなく、対象の群を予測できる能力を持っている。
本稿では,2つの航空画像データセットの実験結果について報告し,提案手法が標準単発検出器よりも精度が高く,計算効率も高いことを示す。
論文 参考訳(メタデータ) (2020-04-27T07:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。