Fugu-MT 論文翻訳(概要): ZoomCount: A Zooming Mechanism for Crowd Counting in Static Images

論文の概要: ZoomCount: A Zooming Mechanism for Crowd Counting in Static Images

arxiv url: http://arxiv.org/abs/2002.12256v1
Date: Thu, 27 Feb 2020 16:57:04 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-28 08:22:58.889497
Title: ZoomCount: A Zooming Mechanism for Crowd Counting in Static Images
Title（参考訳）: zoomcount: 静止画像における群衆カウントのためのズーム機構
Authors: Usman Sajid, Hasan Sajid, Hongcheng Wang, Guanghui Wang
Abstract要約: 現在のアプローチでは、大規模な群衆の多様性をうまく扱えず、極端な場合では性能が良くない。提案手法は,このような極端な事例の検出と処理が,より優れた群集推定につながるという観測に基づいている。
参考スコア（独自算出の注目度）: 22.387393675233124
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper proposes a novel approach for crowd counting in low to high density scenarios in static images. Current approaches cannot handle huge crowd diversity well and thus perform poorly in extreme cases, where the crowd density in different regions of an image is either too low or too high, leading to crowd underestimation or overestimation. The proposed solution is based on the observation that detecting and handling such extreme cases in a specialized way leads to better crowd estimation. Additionally, existing methods find it hard to differentiate between the actual crowd and the cluttered background regions, resulting in further count overestimation. To address these issues, we propose a simple yet effective modular approach, where an input image is first subdivided into fixed-size patches and then fed to a four-way classification module labeling each image patch as low, medium, high-dense or no-crowd. This module also provides a count for each label, which is then analyzed via a specifically devised novel decision module to decide whether the image belongs to any of the two extreme cases (very low or very high density) or a normal case. Images, specified as high- or low-density extreme or a normal case, pass through dedicated zooming or normal patch-making blocks respectively before routing to the regressor in the form of fixed-size patches for crowd estimate. Extensive experimental evaluations demonstrate that the proposed approach outperforms the state-of-the-art methods on four benchmarks under most of the evaluation criteria.
Abstract（参考訳）: 本稿では,静的画像の低密度・高密度シナリオにおける群集数に対する新しいアプローチを提案する。現在のアプローチでは、巨大な群衆の多様性をうまく処理できないため、極端なケースでは、画像の異なる領域の群衆密度が低すぎるか高すぎるため、群衆の過大評価や過大評価につながる。提案手法は,このような極端な事例を特別な方法で検出・処理することで,より優れた群衆推定が可能となるという観測に基づく。さらに、既存の手法では、実際の群衆と散らかった背景領域を区別することは困難であり、その結果、過大評価がさらに増える。そこで我々は,まず入力イメージを固定サイズのパッチに分割し,次に各イメージパッチをロー,中,ハイセンス,ノークロードと分類する4方向分類モジュールに供給する,簡易かつ効果的なモジュラーアプローチを提案する。このモジュールはラベルのカウントも提供し、イメージが2つの極端なケース(非常に低いか、非常に高い密度)または通常のケースに属するかを決定するために、特別に考案された新しい決定モジュールによって分析される。画像は、高密度または低密度の極端または通常のケースとして指定され、それぞれ専用のズームブロックまたは通常のパッチ作成ブロックを通過して、群衆推定のための固定サイズパッチの形式でレグレッタにルーティングする。広範な実験評価の結果,提案手法は評価基準のほとんどにおいて4つのベンチマークにおいて最先端手法を上回っていることがわかった。

関連論文リスト

Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-31T13:12:41Z)
Single Domain Generalization for Crowd Counting [11.212941297348268]
MPCountは、ソース分布が狭い場合でも、新しい効果的なアプローチである。密度マップの回帰のために多様な密度値を格納し、1つのメモリバンクでドメイン不変の特徴を再構築する。様々なシナリオ下での美術品の状態と比較して、カウント精度が著しく向上することが示されている。
論文参考訳（メタデータ） (2024-03-14T06:16:21Z)
Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文参考訳（メタデータ） (2024-02-27T13:55:17Z)
Composed Image Retrieval with Text Feedback via Multi-grained Uncertainty Regularization [73.04187954213471]
粗い検索ときめ細かい検索を同時にモデル化する統合学習手法を提案する。提案手法は、強いベースラインに対して+4.03%、+3.38%、+2.40%のRecall@50精度を達成した。
論文参考訳（メタデータ） (2022-11-14T14:25:40Z)
Boosting Few-shot Fine-grained Recognition with Background Suppression and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文参考訳（メタデータ） (2022-10-04T07:54:40Z)
Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文参考訳（メタデータ） (2021-08-20T14:02:38Z)
A Hierarchical Transformation-Discriminating Generative Model for Few Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文参考訳（メタデータ） (2021-04-29T17:49:48Z)
Multi-frame Super-resolution from Noisy Data [6.414055487487486]
異方性拡散アイデアに基づく2つの適応レギュラーの有用性を示す。また,一方的な差異と優れた性能を有する新しい非局所的な手法を提案する。意外なことに、実際に関連する雑音のシナリオにおける評価は、ノイズフリーのシナリオと異なるランキングを生み出す。
論文参考訳（メタデータ） (2021-03-25T12:07:08Z)
Plug-and-Play Rescaling Based Crowd Counting in Static Images [24.150701096083242]
我々は,新しいイメージパッチ再スケーリングモジュール (PRM) と3つの独立したPRMを用いたクラウドカウント手法を提案する。提案するフレームワークは,PRMモジュールを用いて特別な処理を必要とする画像領域(パッチ)を再スケールする。
論文参考訳（メタデータ） (2020-01-06T21:43:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。