論文の概要: $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models
- arxiv url: http://arxiv.org/abs/2303.12790v3
- Date: Thu, 4 Apr 2024 17:55:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-05 20:51:58.981344
- Title: $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models
- Title(参考訳): $CrowdDiff$:拡散モデルを用いた多仮説集団密度推定
- Authors: Yasiru Ranasinghe, Nithin Gopalakrishnan Nair, Wele Gedara Chaminda Bandara, Vishal M. Patel,
- Abstract要約: 群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
- 参考スコア(独自算出の注目度): 26.55769846846542
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Crowd counting is a fundamental problem in crowd analysis which is typically accomplished by estimating a crowd density map and summing over the density values. However, this approach suffers from background noise accumulation and loss of density due to the use of broad Gaussian kernels to create the ground truth density maps. This issue can be overcome by narrowing the Gaussian kernel. However, existing approaches perform poorly when trained with ground truth density maps with broad kernels. To deal with this limitation, we propose using conditional diffusion models to predict density maps, as diffusion models show high fidelity to training data during generation. With that, we present $CrowdDiff$ that generates the crowd density map as a reverse diffusion process. Furthermore, as the intermediate time steps of the diffusion process are noisy, we incorporate a regression branch for direct crowd estimation only during training to improve the feature learning. In addition, owing to the stochastic nature of the diffusion model, we introduce producing multiple density maps to improve the counting performance contrary to the existing crowd counting pipelines. We conduct extensive experiments on publicly available datasets to validate the effectiveness of our method. $CrowdDiff$ outperforms existing state-of-the-art crowd counting methods on several public crowd analysis benchmarks with significant improvements.
- Abstract(参考訳): 群集カウントは群集解析の基本的な問題であり、群集密度マップを推定し,その密度値について要約することによって達成されるのが典型的である。
しかし、このアプローチは、基底真理密度マップを作成するために広いガウス核を使用するため、背景雑音の蓄積と密度の損失に悩まされる。
この問題はガウス核を狭めることで克服できる。
しかし、既存のアプローチは、広いカーネルを持つ基底真理密度写像で訓練された場合、性能が良くない。
この制限に対処するため、我々は条件付き拡散モデルを用いて密度マップを予測し、拡散モデルは生成時のトレーニングデータに対して高い忠実度を示す。
これにより、逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
さらに,拡散過程の中間段階はノイズが多いため,訓練中にのみ直接集団推定を行う回帰分岐を組み込んで特徴学習を改善する。
また,拡散モデルの確率的性質から,既存の群集計数パイプラインとは対照的なカウント性能を向上させるために,複数の密度マップを作成することを提案する。
提案手法の有効性を検証するために,公開データセットに関する広範な実験を行った。
$CrowdDiff$は、いくつかの公開クラウド分析ベンチマークにおいて、既存の最先端のクラウドカウントメソッドよりも、大幅に改善されている。
関連論文リスト
- Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Denoising Diffusion Samplers [41.796349001299156]
拡散モデルの認知は、多くの領域で最先端の結果を提供する生成モデルの一般的なクラスである。
我々は、非正規化確率密度関数から大まかにサンプリングし、それらの正規化定数を推定する類似のアイデアを探求する。
この文脈ではスコアマッチングは適用できないが、モンテカルロサンプリングのために生成的モデリングで導入された多くのアイデアを利用することができる。
論文 参考訳(メタデータ) (2023-02-27T14:37:16Z) - DensePure: Understanding Diffusion Models towards Adversarial Robustness [110.84015494617528]
拡散モデルの特性を解析し,それらが証明された堅牢性を高める条件を確立する。
事前訓練されたモデル(すなわち分類器)の信頼性向上を目的とした新しいDensePure法を提案する。
このロバストな領域は多重凸集合の和であり、以前の研究で特定されたロバストな領域よりもはるかに大きい可能性が示されている。
論文 参考訳(メタデータ) (2022-11-01T08:18:07Z) - How Much is Enough? A Study on Diffusion Times in Score-based Generative
Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。
本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文 参考訳(メタデータ) (2022-06-10T15:09:46Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Reciprocal Distance Transform Maps for Crowd Counting and People
Localization in Dense Crowd [16.224760698133462]
本稿では,クラウドカウントのためのReciprocal Distance Transform (R-DT) マップを提案する。
密度マップと比較すると、r-dtマップは人口の位置を正確に記述しており、密度の高い地域で近くの頭部が重なり合うことはない。
密度マップをR-DTマップに置き換えることで、クラウドカウントと人々のローカリゼーションを同時にシンプルなネットワークで実現します。
論文 参考訳(メタデータ) (2021-02-16T02:25:55Z) - Generative Learning With Euler Particle Transport [14.557451744544592]
生成学習のためのユーラー粒子輸送(EPT)手法を提案する。
提案手法は, 基準分布から目標分布への最適輸送マップの探索の問題に動機付けられている。
提案する密度比(差分)推定器は,データが低次元多様体上で支持されている場合,「次元の曲線」に支障を来さないことを示す。
論文 参考訳(メタデータ) (2020-12-11T03:10:53Z) - A Strong Baseline for Crowd Counting and Unsupervised People
Localization [2.690502103971799]
本研究では,クラウドカウントのための強力なベースラインと,推定密度マップに基づく非教師なしの人物ローカライゼーションアルゴリズムについて検討する。
さまざまなバックボーンを収集して,その変更の影響を評価します。
そこで本研究では,KMeansと命名されたクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-07T08:29:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。