論文の概要: PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting
- arxiv url: http://arxiv.org/abs/2012.03597v1
- Date: Mon, 7 Dec 2020 11:35:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 11:25:05.527472
- Title: PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting
- Title(参考訳): PSCNet: 群衆カウントのためのピラミッドスケールとグローバルコンテキストガイドネットワーク
- Authors: Guangshuai Gao, Qingjie Liu, Qi Wen, Yunhong Wang
- Abstract要約: 本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
- 参考スコア(独自算出の注目度): 44.306790250158954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Crowd counting, which towards to accurately count the number of the objects
in images, has been attracted more and more attention by researchers recently.
However, challenges from severely occlusion, large scale variation, complex
background interference and non-uniform density distribution, limit the crowd
number estimation accuracy. To mitigate above issues, this paper proposes a
novel crowd counting approach based on pyramidal scale module (PSM) and global
context module (GCM), dubbed PSCNet. Moreover, a reliable supervision manner
combined Bayesian and counting loss (BCL) is utilized to learn the density
probability and then computes the count exception at each annotation point.
Specifically, PSM is used to adaptively capture multi-scale information, which
can identify a fine boundary of crowds with different image scales. GCM is
devised with low-complexity and lightweight manner, to make the interactive
information across the channels of the feature maps more efficient, meanwhile
guide the model to select more suitable scales generated from PSM. Furthermore,
BL is leveraged to construct a credible density contribution probability
supervision manner, which relieves non-uniform density distribution in crowds
to a certain extent. Extensive experiments on four crowd counting datasets show
the effectiveness and superiority of the proposed model. Additionally, some
experiments extended on a remote sensing object counting (RSOC) dataset further
validate the generalization ability of the model. Our resource code will be
released upon the acceptance of this work.
- Abstract(参考訳): 画像中のオブジェクトの数を正確にカウントするクラウドカウントが、近年ますます注目を集めている。
しかし, 厳密な閉塞, 大規模変動, 複雑な背景干渉, 非一様密度分布による課題は, 群集数推定精度を制限している。
本稿では, ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) をベースとした, PSCNet と呼ばれる新しい群集カウント手法を提案する。
さらに、ベイジアンとカウントロス(BCL)を組み合わせた信頼性の高い監視手法を用いて、密度確率を学習し、各アノテーションポイントでカウント例外を算出する。
特にpsmは、画像スケールの異なる群衆の細かい境界を識別できるマルチスケール情報を適応的にキャプチャするために使用される。
GCMは、低複雑さで軽量な方法で設計され、特徴マップのチャネルをまたいだインタラクティブな情報をより効率的にし、一方、PSMからより適切なスケールを選択するようモデルに誘導する。
さらに、BLを利用して信頼性の高い密度寄与確率の監視方法を構築し、群衆の非一様密度分布をある程度緩和する。
4つの群集カウントデータセットの大規模な実験により,提案モデルの有効性と優位性を示した。
さらに、リモートセンシングオブジェクトカウント(RSOC)データセット上に拡張されたいくつかの実験は、モデルの一般化能力をさらに検証した。
当社のリソースコードは、この作業が受け入れられ次第、リリースされます。
関連論文リスト
- Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Multi-Scale Context Aggregation Network with Attention-Guided for Crowd
Counting [23.336181341124746]
群衆カウントは、人の数を予測し、画像内の密度マップを生成することを目的としている。
さまざまなヘッドスケール、画像間の群衆分布の多様性、散らかった背景など、多くの課題がある。
本稿では,クラウドカウントのための単一カラムエンコーダ・デコーダアーキテクチャに基づくマルチスケールコンテキストアグリゲーションネットワーク(mscanet)を提案する。
論文 参考訳(メタデータ) (2021-04-06T02:24:06Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。