論文の概要: CoDi -- an exemplar-conditioned diffusion model for low-shot counting
- arxiv url: http://arxiv.org/abs/2512.20153v1
- Date: Tue, 23 Dec 2025 08:31:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.798898
- Title: CoDi -- an exemplar-conditioned diffusion model for low-shot counting
- Title(参考訳): CoDi--低ショットカウントのための模範条件拡散モデル
- Authors: Grega Šuštar, Jer Pelhan, Alan Lukežič, Matej Kristan,
- Abstract要約: ローショットオブジェクトカウントングアドレスは、テストタイムの例をわずかあるいは全く使用せずに、画像中の未観測オブジェクトの数を推定する。
我々は,物体位置を非最大抑圧によって決定できる高品質な密度マップを生成する,最初の潜伏拡散型低ショットカウンタであるCoDiを提案する。
- 参考スコア(独自算出の注目度): 11.459105904251507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Low-shot object counting addresses estimating the number of previously unobserved objects in an image using only few or no annotated test-time exemplars. A considerable challenge for modern low-shot counters are dense regions with small objects. While total counts in such situations are typically well addressed by density-based counters, their usefulness is limited by poor localization capabilities. This is better addressed by point-detection-based counters, which are based on query-based detectors. However, due to limited number of pre-trained queries, they underperform on images with very large numbers of objects, and resort to ad-hoc techniques like upsampling and tiling. We propose CoDi, the first latent diffusion-based low-shot counter that produces high-quality density maps on which object locations can be determined by non-maxima suppression. Our core contribution is the new exemplar-based conditioning module that extracts and adjusts the object prototypes to the intermediate layers of the denoising network, leading to accurate object location estimation. On FSC benchmark, CoDi outperforms state-of-the-art by 15% MAE, 13% MAE and 10% MAE in the few-shot, one-shot, and reference-less scenarios, respectively, and sets a new state-of-the-art on MCAC benchmark by outperforming the top method by 44% MAE. The code is available at https://github.com/gsustar/CoDi.
- Abstract(参考訳): 低ショットのオブジェクトカウントアドレスは、アノテーション付きテストタイムの例をわずかあるいは全く使用せずに、画像中の未観測オブジェクトの数を推定する。
現代のローショットカウンタにとって大きな課題は、小さな物体を持つ密度の高い領域である。
このような状況における総数は通常密度ベースのカウンタによって対処されるが、それらの有用性はローカライゼーション能力の不足によって制限される。
これは、問合せに基づく検出器に基づく点検出ベースのカウンタにより、よりよく対処される。
しかし、事前訓練されたクエリの数が限られているため、非常に多数のオブジェクトを持つイメージではパフォーマンスが劣り、アップサンプリングやタイリングのようなアドホックなテクニックに頼っている。
我々は,物体位置を非最大抑圧によって決定できる高品質な密度マップを生成する,最初の潜伏拡散型低ショットカウンタであるCoDiを提案する。
我々のコアコントリビューションは、オブジェクトのプロトタイプをデノナイジングネットワークの中間層に抽出し、調整する、新しい例ベースの条件付けモジュールです。
FSCベンチマークでは、CoDiは、いくつかのショット、ワンショット、参照レスシナリオにおいて、15% MAE、13% MAE、10% MAEの最先端をそれぞれ上回り、上位メソッドを44% MAEで上回り、新しい最先端のMCACベンチマークを設定している。
コードはhttps://github.com/gsustar/CoDi.comで公開されている。
関連論文リスト
- Generalized-Scale Object Counting with Gradual Query Aggregation [18.582729412306346]
GECO2は、オブジェクトスケールの問題に明示的に対処するエンドツーエンドのいくつかのショットカウントと検出方法である。
最新の数ショットカウンタを超え、GPUメモリのフットプリントを小さくして3倍高速に動作しながら、検出精度を10%向上する。
論文 参考訳(メタデータ) (2025-11-11T09:52:27Z) - A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation [10.461109095311546]
ローショットオブジェクトカウンタは、注釈付き例題をほとんどあるいは全く使用せずに画像内のオブジェクト数を推定する。
既存のアプローチは、しばしば過一般化と偽陽性検出につながる。
本稿では,オブジェクト検出,セグメンテーション,カウント推定を行う新しいローショットカウンタであるGeCoを紹介する。
論文 参考訳(メタデータ) (2024-09-27T12:20:29Z) - DAVE -- A Detect-and-Verify Paradigm for Low-Shot Counting [10.461109095311546]
ローショットカウンタは、画像の例の少ないものまたは全くないものに基づいて、選択されたカテゴリに対応するオブジェクトの数を推定する。
現在の最先端技術では、対象位置密度マップの合計として総計を見積もっているが、個々の対象位置と大きさは提供していない。
本稿では,検出と検証のパラダイムに基づく低ショットカウンタであるDAVEを提案する。
論文 参考訳(メタデータ) (2024-04-25T14:07:52Z) - Point, Segment and Count: A Generalized Framework for Object Counting [40.192374437785155]
クラスに依存しないオブジェクトカウントは、例ボックスやクラス名に関して、イメージ内のすべてのオブジェクトをカウントすることを目的としている。
本稿では,検出に基づく少数ショットとゼロショットの両方のオブジェクトカウントのための一般化されたフレームワークを提案する。
PseCoは、少数ショット/ゼロショットオブジェクトカウント/検出の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-21T06:55:21Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds [103.8635206945196]
視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
論文 参考訳(メタデータ) (2021-10-10T07:55:44Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z) - Frustratingly Simple Few-Shot Object Detection [98.42824677627581]
希少なクラスにおける既存検出器の最後の層のみを微調整することは、数発の物体検出タスクに不可欠である。
このような単純なアプローチは、現在のベンチマークで約220ポイントのメタ学習方法より優れている。
論文 参考訳(メタデータ) (2020-03-16T00:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。