論文の概要: Dense Point Prediction: A Simple Baseline for Crowd Counting and
Localization
- arxiv url: http://arxiv.org/abs/2104.12505v1
- Date: Mon, 26 Apr 2021 12:08:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:34:22.435841
- Title: Dense Point Prediction: A Simple Baseline for Crowd Counting and
Localization
- Title(参考訳): 密集点予測:群衆数と局所化のための単純なベースライン
- Authors: Yi Wang, Xinyu Hou, and Lap-Pui Chau
- Abstract要約: SCALNetという簡便かつ効果的なクラウドカウント・ローカリゼーションネットワークを提案します。
これらのタスクをピクセル単位での密集した予測問題と考え,エンドツーエンドのフレームワークに統合する。
近年の大規模ベンチマークであるNWPU-Crowdの実験により, 提案手法は, 群集のローカライゼーションおよびカウントタスクにおいて, それぞれ5%以上, 10%以上向上していることがわかった。
- 参考スコア(独自算出の注目度): 17.92958745980573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a simple yet effective crowd counting and
localization network named SCALNet. Unlike most existing works that separate
the counting and localization tasks, we consider those tasks as a pixel-wise
dense prediction problem and integrate them into an end-to-end framework.
Specifically, for crowd counting, we adopt a counting head supervised by the
Mean Square Error (MSE) loss. For crowd localization, the key insight is to
recognize the keypoint of people, i.e., the center point of heads. We propose a
localization head to distinguish dense crowds trained by two loss functions,
i.e., Negative-Suppressed Focal (NSF) loss and False-Positive (FP) loss, which
balances the positive/negative examples and handles the false-positive
predictions. Experiments on the recent and large-scale benchmark, NWPU-Crowd,
show that our approach outperforms the state-of-the-art methods by more than 5%
and 10% improvement in crowd localization and counting tasks, respectively. The
code is publicly available at https://github.com/WangyiNTU/SCALNet.
- Abstract(参考訳): 本論文では,SCALNet という,シンプルながら効果的なクラスタカウントとローカライズネットワークを提案する。
カウントとローカライゼーションのタスクを分離する既存の作業とは異なり、これらのタスクはピクセルワイドな予測問題であり、それらをエンドツーエンドのフレームワークに統合する。
特に,群集カウントには,平均正方形誤差(MSE)の損失によって監督されるカウントヘッドを採用する。
群衆のローカライゼーションにとって重要な洞察は、人のキーポイント、すなわち頭の中心を認識することである。
本研究では,2つの損失関数,すなわち負抑制焦点損失(NSF)と偽陽性損失(FP)の2つの損失関数によって訓練された密集群を識別する局在化ヘッドを提案する。
近年の大規模ベンチマークであるNWPU-Crowdの実験により, 提案手法は, 群集のローカライゼーションおよびカウントタスクにおいて, それぞれ5%以上, 10%以上向上していることがわかった。
コードはhttps://github.com/WangyiNTU/SCALNetで公開されている。
関連論文リスト
- Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - Reinforcing Local Feature Representation for Weakly-Supervised Dense
Crowd Counting [21.26385035473938]
本稿では,局所表現の強化を目的とした自己適応型特徴類似性学習ネットワークとグローバル局所整合性損失を提案する。
異なるバックボーンをベースとした提案手法は,弱教師付き群集数と完全教師付き群集数とのギャップを狭める。
論文 参考訳(メタデータ) (2022-02-22T05:53:51Z) - LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds [103.8635206945196]
視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
論文 参考訳(メタデータ) (2021-10-10T07:55:44Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - Direct Measure Matching for Crowd Counting [59.66286603624411]
そこで本研究では,予測密度マップを散乱点付基底真理に直接回帰する測度に基づく新しい計数手法を提案する。
本稿では, シンクホーンの測位損失を計測するために設計した, 半平衡型のシンクホーン発散を導出する。
論文 参考訳(メタデータ) (2021-07-04T06:37:33Z) - Learning Independent Instance Maps for Crowd Localization [44.6430092887941]
Independent Instance Map segmentation (IIM) という,クラウドローカライゼーションのためのエンドツーエンドかつ簡単なフレームワークを提案する。
IIMセグメントは独立した接続コンポーネントに群集し、位置と群集数を得ます。
異なる密度領域のセグメンテーション品質を向上させるために,微分可能二元化モジュール(bm)を提案する。
BMはローカライズモデルに2つの利点をもたらす: 1) 異なる画像のしきい値マップを適応的に学習し、各インスタンスをより正確に検出する; 2) バイナリ予測とラベルの損失を使ってモデルを直接訓練する。
論文 参考訳(メタデータ) (2020-12-08T02:17:19Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。