論文の概要: LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds
- arxiv url: http://arxiv.org/abs/2110.04727v1
- Date: Sun, 10 Oct 2021 07:55:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 18:08:35.879186
- Title: LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds
- Title(参考訳): LDC-Net:Dense Crowdsのローカライゼーション、検出、カウントのための統一フレームワーク
- Authors: Qi wang, Tao Han, Junyu Gao, Yuan Yuan, Xuelong Li
- Abstract要約: 視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
- 参考スコア(独自算出の注目度): 103.8635206945196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid development in visual crowd analysis shows a trend to count people
by positioning or even detecting, rather than simply summing a density map. It
also enlightens us back to the essence of the field, detection to count, which
can give more abundant crowd information and has more practical applications.
However, some recent work on crowd localization and detection has two
limitations: 1) The typical detection methods can not handle the dense crowds
and a large variation in scale; 2) The density map heuristic methods suffer
from performance deficiency in position and box prediction, especially in high
density or large-size crowds. In this paper, we devise a tailored baseline for
dense crowds location, detection, and counting from a new perspective, named as
LDC-Net for convenience, which has the following features: 1) A strong but
minimalist paradigm to detect objects by only predicting a location map and a
size map, which endows an ability to detect in a scene with any capacity ($0
\sim 10,000+$ persons); 2) Excellent cross-scale ability in facing a large
variation, such as the head ranging in $0 \sim 100,000+$ pixels; 3) Achieve
superior performance in location and box prediction tasks, as well as a
competitive counting performance compared with the density-based methods.
Finally, the source code and pre-trained models will be released.
- Abstract(参考訳): 視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
また、フィールドの本質や数を検出することで、より豊富な群衆情報を提供し、より実用的な応用を実現できるのです。
しかし、群衆の局在化と検出に関する最近の研究には2つの制限がある。
1) 一般的な検出方法は,密集した群集や大規模変動を処理できない。
2) 密度マップのヒューリスティックな手法は, 特に高密度群や大型群集において, 位置予測やボックス予測の性能低下に苦しむ。
本稿では,高密度群集の位置,検出,カウントのための調整されたベースラインを,利便性のためのLCC-Netと呼ばれる新しい視点から考案する。
1) 位置マップとサイズマップのみを予測して物体を検出する強力な最小限のパラダイムであり、任意の容量(0 \sim 10,000+$ person)のシーンで検出することができる。
2)大きな変動に直面する際の優れたクロススケール能力,例えば,0 \sim00,000+$ピクセルの範囲の頭部
3) 位置予測やボックス予測のタスクにおいて, 精度が優れており, 密度に基づく手法と比較して, 競合カウント性能が高い。
最後に、ソースコードと事前訓練されたモデルがリリースされる。
関連論文リスト
- Crowd counting with crowd attention convolutional neural network [23.96936386014949]
我々は、CAT-CNN(Crowd Attention Convolutional Neural Network)と呼ばれる新しいエンドツーエンドモデルを提案する。
我々のCAT-CNNは、自動的に信頼マップを符号化することで、各画素位置における人間の頭の重要性を適応的に評価することができる。
信頼マップの誘導により、推定密度マップにおける人頭の位置がより注目され、最終的な密度マップを符号化することで、膨大な誤判断を効果的に回避することができる。
論文 参考訳(メタデータ) (2022-04-15T06:51:58Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - Dense Point Prediction: A Simple Baseline for Crowd Counting and
Localization [17.92958745980573]
SCALNetという簡便かつ効果的なクラウドカウント・ローカリゼーションネットワークを提案します。
これらのタスクをピクセル単位での密集した予測問題と考え,エンドツーエンドのフレームワークに統合する。
近年の大規模ベンチマークであるNWPU-Crowdの実験により, 提案手法は, 群集のローカライゼーションおよびカウントタスクにおいて, それぞれ5%以上, 10%以上向上していることがわかった。
論文 参考訳(メタデータ) (2021-04-26T12:08:08Z) - Reciprocal Distance Transform Maps for Crowd Counting and People
Localization in Dense Crowd [16.224760698133462]
本稿では,クラウドカウントのためのReciprocal Distance Transform (R-DT) マップを提案する。
密度マップと比較すると、r-dtマップは人口の位置を正確に記述しており、密度の高い地域で近くの頭部が重なり合うことはない。
密度マップをR-DTマップに置き換えることで、クラウドカウントと人々のローカリゼーションを同時にシンプルなネットワークで実現します。
論文 参考訳(メタデータ) (2021-02-16T02:25:55Z) - Learning Independent Instance Maps for Crowd Localization [44.6430092887941]
Independent Instance Map segmentation (IIM) という,クラウドローカライゼーションのためのエンドツーエンドかつ簡単なフレームワークを提案する。
IIMセグメントは独立した接続コンポーネントに群集し、位置と群集数を得ます。
異なる密度領域のセグメンテーション品質を向上させるために,微分可能二元化モジュール(bm)を提案する。
BMはローカライズモデルに2つの利点をもたらす: 1) 異なる画像のしきい値マップを適応的に学習し、各インスタンスをより正確に検出する; 2) バイナリ予測とラベルの損失を使ってモデルを直接訓練する。
論文 参考訳(メタデータ) (2020-12-08T02:17:19Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Towards Using Count-level Weak Supervision for Crowd Counting [55.58468947486247]
本稿では,少数の位置レベルのアノテーション(十分に教師された)と大量のカウントレベルのアノテーション(弱教師付き)からモデルを学習する,弱教師付き群集カウントの問題について検討する。
我々は、生成した密度マップの自由を制限するための正規化を構築するために、単純なyet効果のトレーニング戦略、すなわちMultiple Auxiliary Tasks Training (MATT)を考案した。
論文 参考訳(メタデータ) (2020-02-29T02:58:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。