論文の概要: CountZES: Counting via Zero-Shot Exemplar Selection
- arxiv url: http://arxiv.org/abs/2512.16415v1
- Date: Thu, 18 Dec 2025 11:12:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.026547
- Title: CountZES: Counting via Zero-Shot Exemplar Selection
- Title(参考訳): CountZES: Zero-Shot Exemplar Selectionによるカウント
- Authors: Muhammad Ibraheem Siddiqui, Muhammad Haris Khan,
- Abstract要約: ゼロショット例選択によるオブジェクトカウントのためのトレーニング不要フレームワークであるCountZESを提案する。
CountZESは3つの相乗的段階(DAE)、密度誘導指数(DGE)、特徴合意指数(FCE))を通して様々な相乗的段階を発見する
- 参考スコア(独自算出の注目度): 22.69910219820086
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Object counting in complex scenes remains challenging, particularly in the zero-shot setting, where the goal is to count instances of unseen categories specified only by a class name. Existing zero-shot object counting (ZOC) methods that infer exemplars from text either rely on open-vocabulary detectors, which often yield multi-instance candidates, or on random patch sampling, which fails to accurately delineate object instances. To address this, we propose CountZES, a training-free framework for object counting via zero-shot exemplar selection. CountZES progressively discovers diverse exemplars through three synergistic stages: Detection-Anchored Exemplar (DAE), Density-Guided Exemplar (DGE), and Feature-Consensus Exemplar (FCE). DAE refines open-vocabulary detections to isolate precise single-instance exemplars. DGE introduces a density-driven, self-supervised paradigm to identify statistically consistent and semantically compact exemplars, while FCE reinforces visual coherence through feature-space clustering. Together, these stages yield a diverse, complementary exemplar set that balances textual grounding, count consistency, and feature representativeness. Experiments on diverse datasets demonstrate CountZES superior performance among ZOC methods while generalizing effectively across natural, aerial and medical domains.
- Abstract(参考訳): 複雑なシーンにおけるオブジェクトのカウントは、特にゼロショット設定では、クラス名のみによって指定された見えないカテゴリのインスタンスをカウントすることを目的としている。
テキストから例を推測する既存のゼロショットオブジェクトカウント(ZOC)メソッドは、しばしばマルチインスタンス候補を生成するオープンボキャブラリ検出器か、オブジェクトインスタンスを正確にデライン化できないランダムなパッチサンプリングに依存している。
そこで本研究では,ゼロショット例選択によるオブジェクトカウントのためのトレーニングフリーフレームワークであるCountZESを提案する。
CountZESは3つの相乗的段階(DAE)、密度誘導指数(DGE)、特徴感覚指数指数(FCE)を段階的に発見する。
DAEはオープン語彙の検出を洗練し、正確な単一インスタンスの例を分離する。
DGEは、統計的に一貫性があり、セマンティックにコンパクトな外見を識別するための密度駆動型の自己監督パラダイムを導入し、FCEは特徴空間クラスタリングを通じて視覚的コヒーレンスを強化している。
これらの段階を合わせて、テキストの接地、一貫性のカウント、特徴の表現性のバランスをとる、多様で相補的な模範セットが得られる。
多様なデータセットの実験では、ZOC法ではCountZESが優れた性能を示し、自然、航空、医療領域で効果的に一般化されている。
関連論文リスト
- Improving Generalized Visual Grounding with Instance-aware Joint Learning [45.53531162436934]
汎用的なビジュアルグラウンドタスクは、マルチターゲットおよび非ターゲットシナリオに対応するように設計されている。
本稿では,GRECとGRESの両方に対応するインスタンス認識機能を備えたフレームワークであるInstanceVGを提案する。
フレームワークをインスタンス化するために、各インスタンスクエリに事前参照ポイントを割り当てます。
論文 参考訳(メタデータ) (2025-09-17T07:00:51Z) - Exploring Semantic Clustering and Similarity Search for Heterogeneous Traffic Scenario Graph [41.2584175136191]
まず,交通シナリオを表現するための表現的かつ柔軟な異種時間グラフモデルを提案する。
次に,シナリオグラフに対する普遍的な埋め込み空間を学習するための自己教師付き手法を提案する。
特に、ブートストラップに基づくアプローチとともに、対照的な学習を実装し、シナリオ空間に対するそれらの適合性を評価する。
論文 参考訳(メタデータ) (2025-07-07T15:10:03Z) - ISAC: Training-Free Instance-to-Semantic Attention Control for Improving Multi-Instance Generation [1.3624495460189863]
インスタンス・ツー・セマンティック・アテンション・コントロール(ISAC)は、不完全なインスタンスの形成とセマンティック・エンタングルメントを明示的に解決する。
ISACは平均マルチクラス精度が52%、平均マルチインスタンス精度が83%に達する。
論文 参考訳(メタデータ) (2025-05-27T09:23:10Z) - One size doesn't fit all: Predicting the Number of Examples for In-Context Learning [16.712595387955574]
In-context Learning (ICL)は、ラベル付きデータのトレーニングセットから少量のローカライズされたサンプルをLLMのプロンプトに追加するプロセスを指す。
私たちの作業は、この'one fits all'アプローチの制限を軽減し、数ショットの推論で使用する各データインスタンスの例数を動的に予測します。
テキスト分類ベンチマーク実験の結果,AICLが標準ICLを最大17%上回っていることがわかった。
論文 参考訳(メタデータ) (2024-03-11T03:28:13Z) - EipFormer: Emphasizing Instance Positions in 3D Instance Segmentation [51.996943482875366]
本稿では, プログレッシブアグリゲーションとデュアル位置埋め込みを組み合わせた新しいトランスフォーマーアーキテクチャ, EipFormerを提案する。
EipFormerは最先端のアプローチよりも優れた、あるいは同等のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-12-09T16:08:47Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - K-Shot Contrastive Learning of Visual Features with Multiple Instance
Augmentations [67.46036826589467]
個々のインスタンス内のサンプルのバリエーションを調べるために、$K$-Shot Contrastive Learningが提案されている。
異なるインスタンスを区別するために差別的特徴を学習することで、インスタンス間差別の利点を組み合わせることを目的としている。
提案した$K$-shotのコントラスト学習は、最先端の教師なし手法よりも優れた性能が得られることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-07-27T04:56:41Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。