論文の概要: ProgRoCC: A Progressive Approach to Rough Crowd Counting
- arxiv url: http://arxiv.org/abs/2504.13405v1
- Date: Fri, 18 Apr 2025 01:57:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 19:44:31.995656
- Title: ProgRoCC: A Progressive Approach to Rough Crowd Counting
- Title(参考訳): ProgRoCC: クラウドカウントの進歩的アプローチ
- Authors: Shengqin Jiang, Linfei Li, Haokui Zhang, Qingshan Liu, Amin Beheshti, Jian Yang, Anton van den Hengel, Quan Z. Sheng, Yuankai Qi,
- Abstract要約: 私たちはRough Crowd Countingというラベルを付け、取得が容易なトレーニングデータに基づいて精度を向上します。
本稿では,ProgRoCCと呼ばれるCLIPに基づく大群カウント問題に対するアプローチを提案する。
具体的には、粗大なアプローチによってオブジェクト数を決定するプログレッシブな推定学習戦略を導入する。
- 参考スコア(独自算出の注目度): 66.09510514180593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the number of individuals in a crowd grows, enumeration-based techniques become increasingly infeasible and their estimates increasingly unreliable. We propose instead an estimation-based version of the problem: we label Rough Crowd Counting that delivers better accuracy on the basis of training data that is easier to acquire. Rough crowd counting requires only rough annotations of the number of targets in an image, instead of the more traditional, and far more expensive, per-target annotations. We propose an approach to the rough crowd counting problem based on CLIP, termed ProgRoCC. Specifically, we introduce a progressive estimation learning strategy that determines the object count through a coarse-to-fine approach. This approach delivers answers quickly, outperforms the state-of-the-art in semi- and weakly-supervised crowd counting. In addition, we design a vision-language matching adapter that optimizes key-value pairs by mining effective matches of two modalities to refine the visual features, thereby improving the final performance. Extensive experimental results on three widely adopted crowd counting datasets demonstrate the effectiveness of our method.
- Abstract(参考訳): 集団の個体数が増加するにつれて、列挙に基づくテクニックはますます実現不可能になり、その推定はますます信頼できないものとなる。
代わりに、この問題の見積もりベースのバージョンを提案します。我々は、取得しやすいトレーニングデータに基づいて、より精度の高いRough Crowd Countingをラベル付けします。
より伝統的な、はるかに高価で、ターゲット毎のアノテーションではなく、画像内のターゲット数に関する粗いアノテーションのみを必要とする。
本稿では,ProgRoCCと呼ばれるCLIPに基づく大群カウント問題に対するアプローチを提案する。
具体的には、粗大なアプローチによってオブジェクト数を決定するプログレッシブな推定学習戦略を導入する。
このアプローチは回答を素早く提供し、半監督的、弱監督的な群衆カウントにおいて最先端の手法より優れている。
さらに、2つのモードの有効マッチングをマイニングして、視覚的特徴を洗練し、最終的な性能を向上させることで、キー値対を最適化する視覚言語マッチングアダプタを設計する。
広く採用されている3つの群集カウントデータセットの大規模な実験結果から,本手法の有効性が示された。
関連論文リスト
- Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - CrowdCLIP: Unsupervised Crowd Counting via Vision-Language Model [60.30099369475092]
監視された群衆のカウントは、高価な手作業によるラベリングに大きく依存している。
本稿では,クラウドカウントのための新しい非教師付きフレームワークであるCrowdCLIPを提案する。
CrowdCLIPは、従来の教師なしの最先端カウント手法と比較して、優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-04-09T12:56:54Z) - Counting in the 2020s: Binned Representations and Inclusive Performance
Measures for Deep Crowd Counting Approaches [21.595568866609067]
データセットスキューの知識に合わせてトレーニングパイプラインを変更します。
原理的およびバランスの取れたミニバッチサンプリングを実現するために,新しいスムーズなベイズビンニング手法を提案する。
我々は、より包括的で、ディープネットワークの様々な比較パフォーマンス面に光を当てる、さらなるパフォーマンス対策を導入する。
論文 参考訳(メタデータ) (2022-04-10T11:02:13Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。