論文の概要: Plug-and-Play Rescaling Based Crowd Counting in Static Images
- arxiv url: http://arxiv.org/abs/2001.01786v1
- Date: Mon, 6 Jan 2020 21:43:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 02:28:42.557884
- Title: Plug-and-Play Rescaling Based Crowd Counting in Static Images
- Title(参考訳): 静的画像におけるプラグ・アンド・プレイ・リスケーリングに基づく集団カウント
- Authors: Usman Sajid and Guanghui Wang
- Abstract要約: 我々は,新しいイメージパッチ再スケーリングモジュール (PRM) と3つの独立したPRMを用いたクラウドカウント手法を提案する。
提案するフレームワークは,PRMモジュールを用いて特別な処理を必要とする画像領域(パッチ)を再スケールする。
- 参考スコア(独自算出の注目度): 24.150701096083242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting is a challenging problem especially in the presence of huge
crowd diversity across images and complex cluttered crowd-like background
regions, where most previous approaches do not generalize well and consequently
produce either huge crowd underestimation or overestimation. To address these
challenges, we propose a new image patch rescaling module (PRM) and three
independent PRM employed crowd counting methods. The proposed frameworks use
the PRM module to rescale the image regions (patches) that require special
treatment, whereas the classification process helps in recognizing and
discarding any cluttered crowd-like background regions which may result in
overestimation. Experiments on three standard benchmarks and cross-dataset
evaluation show that our approach outperforms the state-of-the-art models in
the RMSE evaluation metric with an improvement up to 10.4%, and possesses
superior generalization ability to new datasets.
- Abstract(参考訳): 群衆の数え上げは、画像全体にわたる巨大な群衆の多様性と、多くの以前のアプローチがうまく一般化せず、結果として巨大な群衆の過大評価や過大評価を生み出す複雑な群衆のような背景領域の存在において、特に難しい問題である。
これらの課題に対処するため,我々は,新しいイメージパッチリスケーリングモジュール (prm) と3つの独立したprmを提案する。
提案されたフレームワークでは、prmモジュールを使用して、特別な処理を必要とするイメージ領域(パッチ)を再スケールする。
3つの標準ベンチマークとクロスデータセット評価実験により、RMSE評価基準の最先端モデルよりも10.4%向上し、新しいデータセットに優れた一般化能力を有することが示された。
関連論文リスト
- Robust Unsupervised Crowd Counting and Localization with Adaptive
Resolution SAM [61.10712338956455]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Progressive Multi-view Human Mesh Recovery with Self-Supervision [68.60019434498703]
既存のソリューションは通常、新しい設定への一般化性能の低下に悩まされる。
マルチビューヒューマンメッシュリカバリのためのシミュレーションに基づく新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-10T06:28:29Z) - Towards More Effective PRM-based Crowd Counting via A Multi-resolution
Fusion and Attention Network [22.235440703471518]
PRMをベースとしたマルチレゾリューションとマルチタスクのクラウドカウントネットワークを提案する。
提案モデルは3つの深層分岐で構成され,各枝は異なる解像度の特徴写像を生成する。
これらの深部分岐を PRM モジュールや早期適応ブロックと統合することは、元の PRM ベースのスキームよりも効果的であることが証明されている。
論文 参考訳(メタデータ) (2021-12-17T18:17:02Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Multi-Resolution Fusion and Multi-scale Input Priors Based Crowd
Counting [20.467558675556173]
本稿では,マルチレゾリューション・フュージョンに基づくエンドツーエンドのクラウドカウントネットワークを提案する。
PRMモジュールの効率的な代替として、3つの入力先が導入された。
提案手法は, クロスデータセット実験において, 最適な結果を得るために, より優れた一般化能力を有する。
論文 参考訳(メタデータ) (2020-10-04T19:30:13Z) - Shallow Feature Based Dense Attention Network for Crowd Counting [103.67446852449551]
静止画像から群衆を数えるためのShallow機能に基づくDense Attention Network (SDANet)を提案する。
提案手法は,SDANetの11.9%の平均絶対誤差(MAE)低下から明らかなように,既存の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2020-06-17T13:34:42Z) - ZoomCount: A Zooming Mechanism for Crowd Counting in Static Images [22.387393675233124]
現在のアプローチでは、大規模な群衆の多様性をうまく扱えず、極端な場合では性能が良くない。
提案手法は,このような極端な事例の検出と処理が,より優れた群集推定につながるという観測に基づいている。
論文 参考訳(メタデータ) (2020-02-27T16:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。