論文の概要: Adaptive Mixture Regression Network with Local Counting Map for Crowd
Counting
- arxiv url: http://arxiv.org/abs/2005.05776v2
- Date: Wed, 13 May 2020 06:53:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 19:16:43.173420
- Title: Adaptive Mixture Regression Network with Local Counting Map for Crowd
Counting
- Title(参考訳): 群衆カウントのための局所カウントマップを用いた適応混合回帰ネットワーク
- Authors: Xiyang Liu, Jie Yang, Wenrui Ding
- Abstract要約: そこで我々は,密度マップに基づくアプローチよりも正確な結果を得るために,LCM (Local counting map) という新しいターゲットを導入する。
また、3つのモジュールからなる適応型混合回帰フレームワークを粗大な方法で提案し、群衆推定の精度をさらに向上させる。
- 参考スコア(独自算出の注目度): 16.816382549827214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The crowd counting task aims at estimating the number of people located in an
image or a frame from videos. Existing methods widely adopt density maps as the
training targets to optimize the point-to-point loss. While in testing phase,
we only focus on the differences between the crowd numbers and the global
summation of density maps, which indicate the inconsistency between the
training targets and the evaluation criteria. To solve this problem, we
introduce a new target, named local counting map (LCM), to obtain more accurate
results than density map based approaches. Moreover, we also propose an
adaptive mixture regression framework with three modules in a coarse-to-fine
manner to further improve the precision of the crowd estimation: scale-aware
module (SAM), mixture regression module (MRM) and adaptive soft interval module
(ASIM). Specifically, SAM fully utilizes the context and multi-scale
information from different convolutional features; MRM and ASIM perform more
precise counting regression on local patches of images. Compared with current
methods, the proposed method reports better performances on the typical
datasets. The source code is available at
https://github.com/xiyang1012/Local-Crowd-Counting.
- Abstract(参考訳): 群衆カウントタスクは、ビデオから画像やフレームにある人の数を推定することを目的としています。
既存の手法では、ポイント・ツー・ポイントの損失を最適化するためのトレーニングターゲットとして密度マップを広く採用している。
実験段階では, 群集数と密度マップの全体和の差にのみ注目し, 学習目標と評価基準との矛盾を示唆する。
そこで本研究では, 局所カウントマップ (LCM) と呼ばれる新しいターゲットを導入し, 密度マップに基づくアプローチよりも正確な結果を得る。
さらに, 群集推定の精度をさらに向上させるために, 3つのモジュールからなる適応的混合回帰フレームワークを提案し, スケールアウェアモジュール (sam), 混合回帰モジュール (mrm), 適応ソフトインターバルモジュール (asim) を提案する。
具体的には、SAMは、異なる畳み込み特徴からコンテキストとマルチスケールの情報を完全に活用し、MRMとASIMは、画像の局所パッチに対してより正確なカウントレグレッションを実行する。
提案手法は,従来の手法と比較して,典型的なデータセットよりも優れた性能を示す。
ソースコードはhttps://github.com/xiyang1012/local-crowd-countingで入手できる。
関連論文リスト
- DMESA: Densely Matching Everything by Segmenting Anything [16.16319526547664]
本稿では,新しい特徴マッチング手法としてMESAとDMESAを提案する。
MESAはSAMの高度な画像理解に基づいて、点マッチングの前に暗黙のセマンティック領域マッチングを確立する。
繰り返し計算が少ないため、DMESAはMESAと比較して約5倍の速度向上を示す。
論文 参考訳(メタデータ) (2024-08-01T04:39:36Z) - Rethinking Spatial Invariance of Convolutional Networks for Object
Counting [119.83017534355842]
局所連結ガウス核を用いて元の畳み込みフィルタを置き換え、密度写像の空間位置を推定する。
従来の研究から着想を得て,大規模なガウス畳み込みの近似を好意的に実装するために,翻訳不変性を伴う低ランク近似を提案する。
提案手法は,他の最先端手法を著しく上回り,物体の空間的位置の有望な学習を実現する。
論文 参考訳(メタデータ) (2022-06-10T17:51:25Z) - Adaptive Affinity for Associations in Multi-Target Multi-Camera Tracking [53.668757725179056]
本稿では,MTMCTにおけるアフィニティ推定を対応する対応範囲に適応させるための,単純かつ効果的な手法を提案する。
すべての外見の変化に対処する代わりに、データアソシエーション中に出現する可能性のあるものに特化したアフィニティメトリックを調整します。
ミスマッチを最小限に抑えるため、アダプティブアフィニティモジュールはグローバルなre-ID距離を大幅に改善する。
論文 参考訳(メタデータ) (2021-12-14T18:59:11Z) - Reciprocal Distance Transform Maps for Crowd Counting and People
Localization in Dense Crowd [16.224760698133462]
本稿では,クラウドカウントのためのReciprocal Distance Transform (R-DT) マップを提案する。
密度マップと比較すると、r-dtマップは人口の位置を正確に記述しており、密度の高い地域で近くの頭部が重なり合うことはない。
密度マップをR-DTマップに置き換えることで、クラウドカウントと人々のローカリゼーションを同時にシンプルなネットワークで実現します。
論文 参考訳(メタデータ) (2021-02-16T02:25:55Z) - Learning Independent Instance Maps for Crowd Localization [44.6430092887941]
Independent Instance Map segmentation (IIM) という,クラウドローカライゼーションのためのエンドツーエンドかつ簡単なフレームワークを提案する。
IIMセグメントは独立した接続コンポーネントに群集し、位置と群集数を得ます。
異なる密度領域のセグメンテーション品質を向上させるために,微分可能二元化モジュール(bm)を提案する。
BMはローカライズモデルに2つの利点をもたらす: 1) 異なる画像のしきい値マップを適応的に学習し、各インスタンスをより正確に検出する; 2) バイナリ予測とラベルの損失を使ってモデルを直接訓練する。
論文 参考訳(メタデータ) (2020-12-08T02:17:19Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - A Strong Baseline for Crowd Counting and Unsupervised People
Localization [2.690502103971799]
本研究では,クラウドカウントのための強力なベースラインと,推定密度マップに基づく非教師なしの人物ローカライゼーションアルゴリズムについて検討する。
さまざまなバックボーンを収集して,その変更の影響を評価します。
そこで本研究では,KMeansと命名されたクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-07T08:29:03Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。