論文の概要: ZIP: Scalable Crowd Counting via Zero-Inflated Poisson Modeling
- arxiv url: http://arxiv.org/abs/2506.19955v2
- Date: Wed, 16 Jul 2025 22:29:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 13:45:37.415145
- Title: ZIP: Scalable Crowd Counting via Zero-Inflated Poisson Modeling
- Title(参考訳): ZIP:ゼロインフレードポアソンモデリングによるスケーラブルなクラウドカウント
- Authors: Yiming Ma, Victor Sanchez, Tanaya Guha,
- Abstract要約: ZIPは、ゼロインフレポアソン確率でブロックワイズカウントをモデル化するスケーラブルなクラウドカウントフレームワークである。
MSEに基づく損失よりもZIPに縛られるリスクが強いことを一般化分析で示す。
上海工科大学A&B、UCF-QNRF、NWPU-Crowdの実験では、ZIPがあらゆるモデルスケールにわたる最先端の手法を一貫して超越していることが示されている。
- 参考スコア(独自算出の注目度): 29.570935239024138
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most crowd counting methods directly regress blockwise density maps using Mean Squared Error (MSE) losses. This practice has two key limitations: (1) it fails to account for the extreme spatial sparsity of annotations -- over 95% of 8x8 blocks are empty across standard benchmarks, so supervision signals in informative regions are diluted by the predominant zeros; (2) MSE corresponds to a Gaussian error model that poorly matches discrete, non-negative count data. To address these issues, we introduce ZIP, a scalable crowd counting framework that models blockwise counts with a Zero-Inflated Poisson likelihood: a zero-inflation term learns the probability a block is structurally empty (handling excess zeros), while the Poisson component captures expected counts when people are present (respecting discreteness). We provide a generalization analysis showing a tighter risk bound for ZIP than MSE-based losses and DMCount provided that the training resolution is moderately large. To assess the scalability of ZIP, we instantiate it on backbones spanning over 100x in parameters/compute. Experiments on ShanghaiTech A & B, UCF-QNRF, and NWPU-Crowd demonstrate that ZIP consistently surpasses state-of-the-art methods across all model scales.
- Abstract(参考訳): ほとんどの群集カウント法は、平均正方形誤差(MSE)損失を用いてブロックワイド密度マップを直接回帰する。
このプラクティスには2つの重要な制限がある: 1) アノテーションの極端な空間的間隔を考慮できない -- 標準ベンチマークでは8x8ブロックの95%以上が空であるため、情報領域の監視信号は支配的なゼロによって希釈される; 2) MSEは、離散的で非負のカウントデータと不一致なガウス誤差モデルに対応する。
ゼロインフレ項は、ブロックが構造的に空である確率(過剰なゼロを扱う)を学習し、ポアソン成分は、人がいるときに期待されるカウントをキャプチャする(離散性を参照)。
本稿では,MSEに基づく損失よりもZIPのリスクが強いこと,トレーニング解決が適度に大きいことを前提としたDMCountを一般化分析する。
ZIPのスケーラビリティを評価するために、パラメータ/計算の100倍以上のバックボーンでインスタンス化する。
上海工科大学A&B、UCF-QNRF、NWPU-Crowdの実験では、ZIPがあらゆるモデルスケールにわたる最先端の手法を一貫して超越していることが示されている。
関連論文リスト
- Optimal Robust Estimation under Local and Global Corruptions: Stronger Adversary and Smaller Error [10.266928164137635]
アルゴリズムによる頑健な統計は伝統的に、サンプルのごく一部が任意に破損する汚染モデルに焦点を当ててきた。
最近の汚染モデルでは, (i) 古典的ロバスト統計のように, 任意の外れ値のごく一部と (ii) 局所摂動, (ii) サンプルが平均的に有界シフトを行うことのできる2種類の汚染モデルを考える。
理論上最適誤差は, 偶発的局所摂動モデルの下で, 時間内に得られることを示す。
論文 参考訳(メタデータ) (2024-10-22T17:51:23Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - CLIP-EBC: CLIP Can Count Accurately through Enhanced Blockwise Classification [29.570935239024138]
CLIP-EBC(CLIP-EBC)を提案する。
我々のEBCフレームワークは、UCF-QNRFデータセットで44.5%まで既存の分類ベースの手法を改善することができる。
CLIP-EBCは、NWPU-Crowdテストセットの最先端のパフォーマンスを実現し、MAEは58.2、RMSEは268.5で、以前のベストメソッドであるSTEERERよりも8.6%と13.3%改善した。
論文 参考訳(メタデータ) (2024-03-14T11:08:33Z) - A Pseudo-Semantic Loss for Autoregressive Models with Logical
Constraints [87.08677547257733]
ニューロシンボリックAIは、純粋にシンボリックな学習とニューラルな学習のギャップを埋める。
本稿では,ニューラルネットワークの出力分布に対するシンボリック制約の可能性を最大化する方法を示す。
また,スドクと最短経路予測の手法を自己回帰世代として評価した。
論文 参考訳(メタデータ) (2023-12-06T20:58:07Z) - Resampled Confidence Regions with Exponential Shrinkage for the Regression Function of Binary Classification [0.0]
我々は,再サンプリングテストに基づいて,任意のユーザ・センサ信頼度レベルと有限サンプルサイズに対する回帰関数の分布自由信頼領域を構築した。
有限擬次元および逆リプシッツパラメータ化を持つモデルクラスに対する新しい経験的リスクベースアプローチの強い均一性を証明する。
また、k-ネアレスト近傍法についても検討し、排除の確率に基づいて強い点を有界に証明する。
論文 参考訳(メタデータ) (2023-08-03T15:52:27Z) - Uncertainty Voting Ensemble for Imbalanced Deep Regression [20.176217123752465]
本稿では,不均衡なデータから学習するUVOTEを紹介する。
従来の回帰損失を負の対数類似度に置き換え、サンプルワイドのアレタリックな不確実性も予測する。
UVOTEは先行技術より一貫して優れており、同時に精度のよい不確実性評価が得られている。
論文 参考訳(メタデータ) (2023-05-24T14:12:21Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - GP-BART: a novel Bayesian additive regression trees approach using
Gaussian processes [1.03590082373586]
GP-BARTモデル(GP-BART model)は、すべての木間の各終端ノードの予測にGP先行を仮定することで制限に対処するBARTの拡張である。
モデルの有効性は、シミュレーションおよび実世界のデータへの応用を通じて実証され、様々なシナリオにおける従来のモデリング手法のパフォーマンスを上回る。
論文 参考訳(メタデータ) (2022-04-05T11:18:44Z) - Zero-Truncated Poisson Regression for Sparse Multiway Count Data
Corrupted by False Zeros [0.0]
提案手法は, 偽零点によって破損したマルチウェイカウントデータに対する新しい統計的推論手法を提案する。
我々のアプローチはポアソン分布をゼロに切り換えてすべてのゼロ値を無視している。
論文 参考訳(メタデータ) (2022-01-25T00:09:48Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Direct Measure Matching for Crowd Counting [59.66286603624411]
そこで本研究では,予測密度マップを散乱点付基底真理に直接回帰する測度に基づく新しい計数手法を提案する。
本稿では, シンクホーンの測位損失を計測するために設計した, 半平衡型のシンクホーン発散を導出する。
論文 参考訳(メタデータ) (2021-07-04T06:37:33Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Learning Minimax Estimators via Online Learning [55.92459567732491]
確率分布のパラメータを推定するミニマックス推定器を設計する際の問題点を考察する。
混合ケースナッシュ平衡を求めるアルゴリズムを構築した。
論文 参考訳(メタデータ) (2020-06-19T22:49:42Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。