論文の概要: JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method
- arxiv url: http://arxiv.org/abs/2004.03597v2
- Date: Mon, 2 Nov 2020 17:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 00:23:26.420888
- Title: JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method
- Title(参考訳): JHU-CrOWD++: 大規模クラウドカウントデータセットとベンチマーク手法
- Authors: Vishwanath A. Sindagi, Rajeev Yasarla, Vishal M. Patel
- Abstract要約: 我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
- 参考スコア(独自算出の注目度): 92.15895515035795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to its variety of applications in the real-world, the task of single
image-based crowd counting has received a lot of interest in the recent years.
Recently, several approaches have been proposed to address various problems
encountered in crowd counting. These approaches are essentially based on
convolutional neural networks that require large amounts of data to train the
network parameters. Considering this, we introduce a new large scale
unconstrained crowd counting dataset (JHU-CROWD++) that contains "4,372" images
with "1.51 million" annotations. In comparison to existing datasets, the
proposed dataset is collected under a variety of diverse scenarios and
environmental conditions. Specifically, the dataset includes several images
with weather-based degradations and illumination variations, making it a very
challenging dataset. Additionally, the dataset consists of a rich set of
annotations at both image-level and head-level. Several recent methods are
evaluated and compared on this dataset. The dataset can be downloaded from
http://www.crowd-counting.com .
Furthermore, we propose a novel crowd counting network that progressively
generates crowd density maps via residual error estimation. The proposed method
uses VGG16 as the backbone network and employs density map generated by the
final layer as a coarse prediction to refine and generate finer density maps in
a progressive fashion using residual learning. Additionally, the residual
learning is guided by an uncertainty-based confidence weighting mechanism that
permits the flow of only high-confidence residuals in the refinement path. The
proposed Confidence Guided Deep Residual Counting Network (CG-DRCN) is
evaluated on recent complex datasets, and it achieves significant improvements
in errors.
- Abstract(参考訳): 現実世界での応用が多種多様であるため、単一の画像ベースの群衆カウントのタスクは近年多くの関心を集めている。
近年,群集カウントにおける様々な問題に対処する手法が提案されている。
これらのアプローチは本質的に畳み込みニューラルネットワークに基づいており、ネットワークパラメータをトレーニングするために大量のデータを必要とする。
これを踏まえて,「1.51百万」アノテーション付き「4,372」画像を含む,新たな大規模無拘束群数データセット(jhu-crowd++)を提案する。
既存のデータセットと比較して,提案データセットはさまざまなシナリオや環境条件下で収集される。
特に、データセットには、天気に基づく劣化と照明のバリエーションのあるいくつかの画像が含まれており、非常に困難なデータセットとなっている。
さらにデータセットは、画像レベルとヘッドレベルの両方で豊富なアノテーションセットで構成されている。
いくつかの手法が評価され、このデータセットで比較される。
データセットはhttp://www.crowd-counting.comからダウンロードできる。
さらに,残差誤差推定により漸進的に群集密度マップを生成する新しい群集計数ネットワークを提案する。
提案手法では,vgg16をバックボーンネットワークとして使用し,最終層が生成する密度マップを粗い予測として活用し,残差学習を用いてより微細な密度マップを洗練・生成する。
さらに、残差学習を不確実性に基づく信頼度重み付け機構により誘導し、精錬経路における高信頼残差のみの流れを許容する。
提案したConfidence Guided Deep Residual Counting Network (CG-DRCN)は、最近の複雑なデータセットで評価され、エラーを大幅に改善する。
関連論文リスト
- An evaluation of Deep Learning based stereo dense matching dataset shift
from aerial images and a large scale stereo dataset [2.048226951354646]
そこで本研究では,光検出・ランドング(LiDAR)と画像から直接地中不均質マップを生成する手法を提案する。
多様なシーンタイプ、画像解像度、幾何学的構成を持つデータセット間の11の密マッチング手法を評価した。
論文 参考訳(メタデータ) (2024-02-19T20:33:46Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method [52.182698295053264]
リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。
これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文 参考訳(メタデータ) (2020-08-28T03:47:49Z) - Bayesian Multi Scale Neural Network for Crowd Counting [0.0]
本稿では,ResNetベースの特徴抽出器,拡張畳み込みを用いたダウンサンプリングブロック,変換畳み込みを用いたアップサンプリングブロックを用いた新しいネットワークを提案する。
本稿では,視点視点問題に対してネットワークを堅牢化する新しいアグリゲーションモジュールを提案する。
論文 参考訳(メタデータ) (2020-07-11T21:43:20Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。