論文の概要: PDANet: Pyramid Density-aware Attention Net for Accurate Crowd Counting
- arxiv url: http://arxiv.org/abs/2001.05643v10
- Date: Wed, 15 Apr 2020 02:21:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 23:44:18.623177
- Title: PDANet: Pyramid Density-aware Attention Net for Accurate Crowd Counting
- Title(参考訳): PDANet: 正確なクラウドカウントのためのピラミッド密度認識アテンションネット
- Authors: Saeed Amirgholipour, Xiangjian He, Wenjing Jia, Dadong Wang, and Lei
Liu
- Abstract要約: 関心領域内の群衆密度の大規模な変動のため、群衆カウントは依然としてオープンな現実の問題である。
PDANetと略される新しいピラミッド密度認識型ネットワークを提案する。これは、注目度、ピラミッドスケール機能、および2つの分岐デコーダモジュールを活用して、密度認識型クラウドカウントを行う。
- 参考スコア(独自算出の注目度): 7.02081613648832
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting, i.e., estimating the number of people in a crowded area, has
attracted much interest in the research community. Although many attempts have
been reported, crowd counting remains an open real-world problem due to the
vast scale variations in crowd density within the interested area, and severe
occlusion among the crowd. In this paper, we propose a novel Pyramid
Density-Aware Attention-based network, abbreviated as PDANet, that leverages
the attention, pyramid scale feature and two branch decoder modules for
density-aware crowd counting. The PDANet utilizes these modules to extract
different scale features, focus on the relevant information, and suppress the
misleading ones. We also address the variation of crowdedness levels among
different images with an exclusive Density-Aware Decoder (DAD). For this
purpose, a classifier evaluates the density level of the input features and
then passes them to the corresponding high and low crowded DAD modules.
Finally, we generate an overall density map by considering the summation of low
and high crowded density maps as spatial attention. Meanwhile, we employ two
losses to create a precise density map for the input scene. Extensive
evaluations conducted on the challenging benchmark datasets well demonstrate
the superior performance of the proposed PDANet in terms of the accuracy of
counting and generated density maps over the well-known state of the arts.
- Abstract(参考訳): 群衆の数え方、すなわち混雑した地域の人々の数を推定することは、研究コミュニティに大きな関心を集めている。
多くの試みが報告されているが、興味のあるエリア内の群衆密度の広範囲な変動と、群衆の激しい閉塞のために、群衆の数え上げはオープンな現実の問題のままである。
本稿では,注意度,ピラミッドスケール,および2つの分岐デコーダモジュールを利用した,pdanetと略される新しいピラミッド密度認識アテンションベースネットワークを提案する。
PDANetはこれらのモジュールを使用して、異なるスケールの特徴を抽出し、関連する情報に集中し、誤解を招くものを抑制する。
また,専用密度認識デコーダ(DAD)を用いて,画像間の密集度の変化に対処する。
この目的のために、分類器は入力特徴の密度レベルを評価し、対応する高密度かつ低密度のDADモジュールに渡す。
最後に,空間的注意として低密度・高密度マップの総和を考慮し,全体密度マップを生成する。
一方,入力シーンの正確な密度マップを作成するのに2つの損失を用いる。
難解なベンチマークデータセットで行った広範な評価は、よく知られた芸術の状況に対するカウントと生成密度マップの精度の観点から、提案するpdanetの優れた性能を示している。
関連論文リスト
- CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting [10.332817296500533]
群集密度予測タスクは,過去の群集密度マップから今後,群集密度マップがどのように変化するかを予測することを目的としている。
過去の群衆密度マップは、歩行者のミス検出のため、しばしば不完全である。
本稿では,クラウド密度予測(CrowdMAC)のためのMAsked crowd density Completionフレームワークを提案する。
CrowdMACは、部分的に隠された過去の群衆密度マップから、将来の群衆密度マップを予測するために同時に訓練されている。
論文 参考訳(メタデータ) (2024-07-20T02:18:43Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - Crowd counting with crowd attention convolutional neural network [23.96936386014949]
我々は、CAT-CNN(Crowd Attention Convolutional Neural Network)と呼ばれる新しいエンドツーエンドモデルを提案する。
我々のCAT-CNNは、自動的に信頼マップを符号化することで、各画素位置における人間の頭の重要性を適応的に評価することができる。
信頼マップの誘導により、推定密度マップにおける人頭の位置がより注目され、最終的な密度マップを符号化することで、膨大な誤判断を効果的に回避することができる。
論文 参考訳(メタデータ) (2022-04-15T06:51:58Z) - LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds [103.8635206945196]
視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
論文 参考訳(メタデータ) (2021-10-10T07:55:44Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Multi-Scale Context Aggregation Network with Attention-Guided for Crowd
Counting [23.336181341124746]
群衆カウントは、人の数を予測し、画像内の密度マップを生成することを目的としている。
さまざまなヘッドスケール、画像間の群衆分布の多様性、散らかった背景など、多くの課題がある。
本稿では,クラウドカウントのための単一カラムエンコーダ・デコーダアーキテクチャに基づくマルチスケールコンテキストアグリゲーションネットワーク(mscanet)を提案する。
論文 参考訳(メタデータ) (2021-04-06T02:24:06Z) - Coarse- and Fine-grained Attention Network with Background-aware Loss
for Crowd Density Map Estimation [2.690502103971799]
CFANetは、高品質な群衆密度マップを生成する新しい方法であり、人を数える。
集合領域認識器 (CRR) と密度レベル推定器 (DLE) を結合して, 粗大から細大に進行する注意機構を考案する。
提案手法は,従来の最先端手法をカウント精度で上回るだけでなく,密度マップの画質の向上や,誤認識率の低減にも寄与する。
論文 参考訳(メタデータ) (2020-11-07T08:05:54Z) - CNN-based Density Estimation and Crowd Counting: A Survey [65.06491415951193]
本稿では,主にCNNに基づく密度マップ推定法において,群集数モデルについて包括的に検討する。
評価指標から, 観客数データセットで上位3人のパフォーマーを選択した。
我々は、今後のクラウドカウントの展開について、合理的な推測と予測を行うことを期待する。
論文 参考訳(メタデータ) (2020-03-28T13:17:30Z) - 3D Crowd Counting via Multi-View Fusion with 3D Gaussian Kernels [56.964614522968226]
マルチビュー・マルチスケール(MVMS)と呼ばれる,エンドツーエンドのマルチビュー・クラウドカウント手法を提案する。
MVMSとは違って,2次元地上平面ではなく3次元シーンレベルの密度マップと3次元特徴融合により,群集カウントタスクを解くことを提案する。
提案手法は3つのマルチビューカウンティングデータセット上でテストされ、最先端のカウンティング性能を向上する。
論文 参考訳(メタデータ) (2020-03-18T11:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。