論文の概要: Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework
- arxiv url: http://arxiv.org/abs/2107.12746v1
- Date: Tue, 27 Jul 2021 11:41:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 14:39:36.078442
- Title: Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework
- Title(参考訳): 群衆におけるカウントとローカライゼーションの再考:純粋にポイントに基づく枠組み
- Authors: Qingyu Song, Changan Wang, Zhengkai Jiang, Yabiao Wang, Ying Tai,
Chengjie Wang, Jilin Li, Feiyue Huang, Yang Wu
- Abstract要約: そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
- 参考スコア(独自算出の注目度): 59.578339075658995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Localizing individuals in crowds is more in accordance with the practical
demands of subsequent high-level crowd analysis tasks than simply counting.
However, existing localization based methods relying on intermediate
representations (\textit{i.e.}, density maps or pseudo boxes) serving as
learning targets are counter-intuitive and error-prone. In this paper, we
propose a purely point-based framework for joint crowd counting and individual
localization. For this framework, instead of merely reporting the absolute
counting error at image level, we propose a new metric, called density
Normalized Average Precision (nAP), to provide more comprehensive and more
precise performance evaluation. Moreover, we design an intuitive solution under
this framework, which is called Point to Point Network (P2PNet). P2PNet
discards superfluous steps and directly predicts a set of point proposals to
represent heads in an image, being consistent with the human annotation
results. By thorough analysis, we reveal the key step towards implementing such
a novel idea is to assign optimal learning targets for these proposals.
Therefore, we propose to conduct this crucial association in an one-to-one
matching manner using the Hungarian algorithm. The P2PNet not only
significantly surpasses state-of-the-art methods on popular counting
benchmarks, but also achieves promising localization accuracy. The codes will
be available at: https://github.com/TencentYoutuResearch/CrowdCounting-P2PNet.
- Abstract(参考訳): 個人を群衆にローカライズすることは、単に数えるよりも、その後の高レベルの群衆分析タスクの実用的な要求に従っている。
しかし、既存のローカライズベース手法は中間表現 (\textit{i.e.) に依存する。
学習対象として機能する密度マップや擬似ボックスは直観的かつ誤りやすい。
本稿では,集合群数と個別の局所化のための純粋にポイントベースな枠組みを提案する。
本研究では,画像レベルで絶対計数誤差を報告するのではなく,密度正規化平均精度(nap)と呼ばれる新しい指標を提案し,より包括的かつ高精度な性能評価を行う。
さらに,P2PNet(Point to Point Network)と呼ばれる,直感的なソリューションを設計する。
p2pnetは過剰なステップを捨て、画像内の頭を表す一連のポイントプロポーザルを直接予測し、人間の注釈結果と一致します。
徹底的な分析により,このような新しいアイデアを実現するための重要なステップは,これらの提案に最適な学習目標を割り当てることである。
そこで本研究では,ハンガリーのアルゴリズムを用いて,この重要な関連を1対1で行うことを提案する。
P2PNetは、一般的なカウントベンチマークの最先端メソッドをはるかに上回るだけでなく、有望なローカライゼーション精度も達成している。
コードはhttps://github.com/tencentyouturesearch/crowdcounting-p2pnet。
関連論文リスト
- Dense Center-Direction Regression for Object Counting and Localization with Point Supervision [1.9526430269580954]
本稿では,CeDiRNetと呼ばれる新しい学習手法を提案する。
最寄りの物体中心を向いている方向の高密度な回帰を利用する。
既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-26T17:49:27Z) - CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - P2Net: A Post-Processing Network for Refining Semantic Segmentation of
LiDAR Point Cloud based on Consistency of Consecutive Frames [25.63934234109252]
本稿では,ポイントクラウドシーケンスのセマンティックセグメンテーション結果を洗練するための軽量な後処理手法を提案する。
P2Netと呼ばれるこのネットワークは、登録後の連続フレームから一致点間の整合性制約を学習する。
提案手法の有効性は,2つの代表ネットワークが予測した結果と,後処理ネットワークによる改善の有無を比較して検証する。
論文 参考訳(メタデータ) (2022-12-01T15:13:38Z) - Dense Point Prediction: A Simple Baseline for Crowd Counting and
Localization [17.92958745980573]
SCALNetという簡便かつ効果的なクラウドカウント・ローカリゼーションネットワークを提案します。
これらのタスクをピクセル単位での密集した予測問題と考え,エンドツーエンドのフレームワークに統合する。
近年の大規模ベンチマークであるNWPU-Crowdの実験により, 提案手法は, 群集のローカライゼーションおよびカウントタスクにおいて, それぞれ5%以上, 10%以上向上していることがわかった。
論文 参考訳(メタデータ) (2021-04-26T12:08:08Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - LFD-ProtoNet: Prototypical Network Based on Local Fisher Discriminant
Analysis for Few-shot Learning [98.64231310584614]
Prototypeal Network (ProtoNet) は、各クラスのプロトタイプ表現までの距離を用いてメートル法学習と分類を行う、数発の学習フレームワークである。
提案手法の有用性は,理論上は予測されるリスクバウンドを提供し,MiniImageNetとタイレッドImageNetに優れた分類精度を実証的に示すことによって示される。
論文 参考訳(メタデータ) (2020-06-15T11:56:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。