論文の概要: FGENet: Fine-Grained Extraction Network for Congested Crowd Counting
- arxiv url: http://arxiv.org/abs/2401.01208v1
- Date: Tue, 2 Jan 2024 13:31:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 13:48:50.402733
- Title: FGENet: Fine-Grained Extraction Network for Congested Crowd Counting
- Title(参考訳): fgenet: 群集計数のための細粒度抽出ネットワーク
- Authors: Hao-Yuan Ma, Li Zhang, Xiang-Yi Wei
- Abstract要約: ファイングラインド抽出ネットワーク(FGENet)と呼ばれるエンドツーエンドモデルを提案する。
密度写像を推定する手法と異なり、FGENETは個人の正確な局在を表す元の座標点を直接学習する。
FGENetは、UCF_CC_50データセットの以前のベンチマークを上回り、MAEで30.16ポイント向上した。
- 参考スコア(独自算出の注目度): 4.145422873316857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting has gained significant popularity due to its practical
applications. However, mainstream counting methods ignore precise individual
localization and suffer from annotation noise because of counting from
estimating density maps. Additionally, they also struggle with high-density
images.To address these issues, we propose an end-to-end model called
Fine-Grained Extraction Network (FGENet). Different from methods estimating
density maps, FGENet directly learns the original coordinate points that
represent the precise localization of individuals.This study designs a fusion
module, named Fine-Grained Feature Pyramid(FGFP), that is used to fuse feature
maps extracted by the backbone of FGENet. The fused features are then passed to
both regression and classification heads, where the former provides predicted
point coordinates for a given image, and the latter determines the confidence
level for each predicted point being an individual. At the end, FGENet
establishes correspondences between prediction points and ground truth points
by employing the Hungarian algorithm. For training FGENet, we design a robust
loss function, named Three-Task Combination (TTC), to mitigate the impact of
annotation noise. Extensive experiments are conducted on four widely used crowd
counting datasets. Experimental results demonstrate the effectiveness of
FGENet. Notably, our method achieves a remarkable improvement of 3.14 points in
Mean Absolute Error (MAE) on the ShanghaiTech Part A dataset, showcasing its
superiority over the existing state-of-the-art methods. Even more impressively,
FGENet surpasses previous benchmarks on the UCF\_CC\_50 dataset with an
astounding enhancement of 30.16 points in MAE.
- Abstract(参考訳): 群衆の数え上げはその実用的利用によって大きな人気を得た。
しかし,本手法は精度の高い局所化を無視し,密度マップを推定した結果,アノテーションノイズに悩まされる。
また,これらの問題に対処するために,細粒度抽出ネットワーク(fgenet)と呼ばれるエンド・ツー・エンドモデルを提案する。
密度マップを推定する手法と異なり、FGENetは個人の位置を正確に表す元の座標点を直接学習し、FGENetの背骨から抽出した特徴マップを融合させるFGFP(Fined Feature Pyramid)と呼ばれる融合モジュールを設計する。
そして、融合した特徴を回帰と分類の両方のヘッドに渡すと、前者が所定の画像に対して予測点座標を提供し、後者が予測点毎の信頼度を決定する。
最後に、FGENetはハンガリーのアルゴリズムを用いて予測点と基底真理点の対応を確立する。
FGENetをトレーニングするために,アノテーションノイズの影響を軽減するために,TTC(Three-Task Combination)と呼ばれるロバストな損失関数を設計する。
大規模な実験は、4つの広く利用されている群集カウントデータセットで実施される。
実験結果からFGENetの有効性が示された。
特に,上海技術パートAデータセットにおける平均絶対誤差(MAE)の3.14点の顕著な改善を実現し,既存の最先端手法よりも優れていることを示す。
さらに印象的なことに、FGENetはUCF\_CC\_50データセットの以前のベンチマークを上回り、MAEの30.16ポイントの驚くべき拡張を実現している。
関連論文リスト
- Unsupervised Landmark Discovery Using Consistency Guided Bottleneck [63.624186864522315]
画像再構成に基づくパイプラインに一貫性のあるボトルネックを導入する。
本稿では,画像間のランドマーク対応を形成することによって,擬似スーパービジョンを得る手法を提案する。
この一貫性は、アダプティブ・ヒートマップの生成において発見されたランドマークの不確かさを変調する。
論文 参考訳(メタデータ) (2023-09-19T10:57:53Z) - DELFlow: Dense Efficient Learning of Scene Flow for Large-Scale Point
Clouds [42.64433313672884]
2次元グリッドに3次元座標を格納することで,原点を高密度フォーマットに正規化する。
既存の作業でよく使われるサンプリング操作とは異なり、密度の高い2D表現はほとんどの点を保存する。
また,情報損失問題を緩和する新しいワーププロジェクション手法を提案する。
論文 参考訳(メタデータ) (2023-08-08T16:37:24Z) - Focus for Free in Density-Based Counting [56.961229110268036]
利用可能なポイントアノテーションを再利用して、カウント性能を向上させる2つの方法を紹介します。
1つ目は、ポイントアノテーションを利用して、入力画像と密度画像の両方で隠蔽されたオブジェクトをシミュレートするカウント固有の拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
論文 参考訳(メタデータ) (2023-06-08T11:54:37Z) - Grad-PU: Arbitrary-Scale Point Cloud Upsampling via Gradient Descent
with Learned Distance Functions [77.32043242988738]
我々は、任意のアップサンプリングレートをサポートする、正確なポイントクラウドアップサンプリングのための新しいフレームワークを提案する。
提案手法は,まず,所定のアップサンプリング率に応じて低解像度の雲を補間する。
論文 参考訳(メタデータ) (2023-04-24T06:36:35Z) - Mask Focal Loss: A unifying framework for dense crowd counting with
canonical object detection networks [9.497237585758695]
本稿では,ガウスカーネルを用いたヒートマップに基づく新しいマスク・フォカル・ロス(MFL)を提案する。
MFLは、ヒートマップとバイナリフィーチャーマップの両方の真実に基づいて、損失関数を統一するフレームワークを提供する。
MAEとRMSEをそれぞれ47.03%、61.99%削減することができる。
論文 参考訳(メタデータ) (2022-12-22T08:43:02Z) - Learning Dense Features for Point Cloud Registration Using Graph
Attention Network [0.0]
本稿では,ポイントクラウドマッチングと登録のためのグラフアテンションネットワークを用いて,高密度特徴を効率的かつ経済的に抽出するフレームワークを提案する。
DFGATの検出器は、大規模な生データセットにおいて、信頼性の高いキーポイントを見つける責任がある。
グラフアテンションネットワークは、ポイントクラウド間の関係を強化するアテンションメカニズムを使用している。
論文 参考訳(メタデータ) (2022-06-14T10:28:57Z) - Rethinking Spatial Invariance of Convolutional Networks for Object
Counting [119.83017534355842]
局所連結ガウス核を用いて元の畳み込みフィルタを置き換え、密度写像の空間位置を推定する。
従来の研究から着想を得て,大規模なガウス畳み込みの近似を好意的に実装するために,翻訳不変性を伴う低ランク近似を提案する。
提案手法は,他の最先端手法を著しく上回り,物体の空間的位置の有望な学習を実現する。
論文 参考訳(メタデータ) (2022-06-10T17:51:25Z) - Direct Measure Matching for Crowd Counting [59.66286603624411]
そこで本研究では,予測密度マップを散乱点付基底真理に直接回帰する測度に基づく新しい計数手法を提案する。
本稿では, シンクホーンの測位損失を計測するために設計した, 半平衡型のシンクホーン発散を導出する。
論文 参考訳(メタデータ) (2021-07-04T06:37:33Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。