論文の概要: ZIP: Scalable Crowd Counting via Zero-Inflated Poisson Modeling
- arxiv url: http://arxiv.org/abs/2506.19955v3
- Date: Thu, 31 Jul 2025 14:46:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 15:10:45.115896
- Title: ZIP: Scalable Crowd Counting via Zero-Inflated Poisson Modeling
- Title(参考訳): ZIP:ゼロインフレードポアソンモデリングによるスケーラブルなクラウドカウント
- Authors: Yiming Ma, Victor Sanchez, Tanaya Guha,
- Abstract要約: ZIPは、ゼロインフレポアソン確率でブロックワイズカウントをモデル化するスケーラブルなクラウドカウントフレームワークである。
MSEに基づく損失よりもZIPに縛られるリスクが強いことを一般化分析で示す。
上海工科大学A&B、UCF-QNRF、NWPU-Crowdの実験では、ZIPがあらゆるモデルスケールにわたる最先端の手法を一貫して超越していることが示されている。
- 参考スコア(独自算出の注目度): 29.570935239024138
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most crowd counting methods directly regress blockwise density maps using Mean Squared Error (MSE) losses. This practice has two key limitations: (1) it fails to account for the extreme spatial sparsity of annotations - over 95% of 8x8 blocks are empty across standard benchmarks, so supervision signals in informative regions are diluted by the predominant zeros; (2) MSE corresponds to a Gaussian error model that poorly matches discrete, non-negative count data. To address these issues, we introduce ZIP, a scalable crowd counting framework that models blockwise counts with a Zero-Inflated Poisson likelihood: a zero-inflation term learns the probability a block is structurally empty (handling excess zeros), while the Poisson component captures expected counts when people are present (respecting discreteness). We provide a generalization analysis showing a tighter risk bound for ZIP than MSE-based losses and DMCount provided that the training resolution is moderately large. To assess the scalability of ZIP, we instantiate it on backbones spanning over 100x in parameters/compute. Experiments on ShanghaiTech A & B, UCF-QNRF, and NWPU-Crowd demonstrate that ZIP consistently surpasses state-of-the-art methods across all model scales.
- Abstract(参考訳): ほとんどの群集カウント法は、平均正方形誤差(MSE)損失を用いてブロックワイド密度マップを直接回帰する。
このプラクティスには2つの重要な制限がある: 1) アノテーションの極端な空間的間隔を考慮できない - 標準ベンチマークで8x8ブロックの95%以上は空であるため、情報領域の監視信号は支配的なゼロによって希釈される; 2) MSEは、離散的で非負のカウントデータと不一致なガウス誤差モデルに対応する。
ゼロインフレ項は、ブロックが構造的に空である確率(過剰なゼロを扱う)を学習し、ポアソン成分は、人がいるときに期待されるカウントをキャプチャする(離散性を参照)。
本稿では,MSEに基づく損失よりもZIPのリスクが強いこと,トレーニング解決が適度に大きいことを前提としたDMCountを一般化分析する。
ZIPのスケーラビリティを評価するために、パラメータ/計算の100倍以上のバックボーンでインスタンス化する。
上海工科大学A&B、UCF-QNRF、NWPU-Crowdの実験では、ZIPがあらゆるモデルスケールにわたる最先端の手法を一貫して超越していることが示されている。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - CLIP-EBC: CLIP Can Count Accurately through Enhanced Blockwise Classification [29.570935239024138]
CLIP-EBC(CLIP-EBC)を提案する。
我々のEBCフレームワークは、UCF-QNRFデータセットで44.5%まで既存の分類ベースの手法を改善することができる。
CLIP-EBCは、NWPU-Crowdテストセットの最先端のパフォーマンスを実現し、MAEは58.2、RMSEは268.5で、以前のベストメソッドであるSTEERERよりも8.6%と13.3%改善した。
論文 参考訳(メタデータ) (2024-03-14T11:08:33Z) - Uncertainty Voting Ensemble for Imbalanced Deep Regression [20.176217123752465]
本稿では,不均衡なデータから学習するUVOTEを紹介する。
従来の回帰損失を負の対数類似度に置き換え、サンプルワイドのアレタリックな不確実性も予測する。
UVOTEは先行技術より一貫して優れており、同時に精度のよい不確実性評価が得られている。
論文 参考訳(メタデータ) (2023-05-24T14:12:21Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - GP-BART: a novel Bayesian additive regression trees approach using
Gaussian processes [1.03590082373586]
GP-BARTモデル(GP-BART model)は、すべての木間の各終端ノードの予測にGP先行を仮定することで制限に対処するBARTの拡張である。
モデルの有効性は、シミュレーションおよび実世界のデータへの応用を通じて実証され、様々なシナリオにおける従来のモデリング手法のパフォーマンスを上回る。
論文 参考訳(メタデータ) (2022-04-05T11:18:44Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。