論文の概要: Region-Aware Network: Model Human's Top-Down Visual Perception Mechanism
for Crowd Counting
- arxiv url: http://arxiv.org/abs/2106.12163v1
- Date: Wed, 23 Jun 2021 05:11:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-24 22:45:18.920996
- Title: Region-Aware Network: Model Human's Top-Down Visual Perception Mechanism
for Crowd Counting
- Title(参考訳): 地域意識ネットワーク: 群衆カウントのためのモデル人間のトップダウン視覚知覚メカニズム
- Authors: Yuehai Chen, Jing Yang, Dong Zhang, Kun Zhang, Badong Chen and Shaoyi
Du
- Abstract要約: 背景雑音とスケール変動は、群集数で長年認識されてきた一般的な問題である。
本研究では,人間のトップダウン視覚知覚機構をモデル化し,RANetと呼ばれる領域認識ブロックを用いた新しいフィードバックネットワークを提案する。
提案手法は,いくつかの公開データセットにおいて,最先端の群集カウント法より優れる。
- 参考スコア(独自算出の注目度): 33.09330894823192
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background noise and scale variation are common problems that have been long
recognized in crowd counting. Humans glance at a crowd image and instantly know
the approximate number of human and where they are through attention the crowd
regions and the congestion degree of crowd regions with a global receptive
filed. Hence, in this paper, we propose a novel feedback network with
Region-Aware block called RANet by modeling human's Top-Down visual perception
mechanism. Firstly, we introduce a feedback architecture to generate priority
maps that provide prior about candidate crowd regions in input images. The
prior enables the RANet pay more attention to crowd regions. Then we design
Region-Aware block that could adaptively encode the contextual information into
input images through global receptive field. More specifically, we scan the
whole input images and its priority maps in the form of column vector to obtain
a relevance matrix estimating their similarity. The relevance matrix obtained
would be utilized to build global relationships between pixels. Our method
outperforms state-of-the-art crowd counting methods on several public datasets.
- Abstract(参考訳): 背景雑音とスケール変動は、群集数で長年認識されてきた一般的な問題である。
人間は群衆のイメージをちらっと見て、人間のほぼ数を瞬時に把握し、群衆の領域や、地球規模の受容性のある群衆の混雑度に注意を払います。
そこで本稿では,人間のトップダウン視覚認識機構をモデル化し,RANetと呼ばれる領域認識ブロックを用いた新しいフィードバックネットワークを提案する。
まず,入力画像中の候補群領域を優先する優先順位マップを生成するためのフィードバックアーキテクチャを提案する。
前者により、ラネットは群衆地域にもっと注意を払うことができる。
次に、グローバルレセプティブフィールドを介して、文脈情報を入力画像に適応的にエンコードできる領域認識ブロックを設計する。
具体的には、入力画像全体とその優先度マップを列ベクトルの形でスキャンし、それらの類似性を推定する関連行列を得る。
得られた関連行列は、ピクセル間のグローバルな関係を構築するために使用される。
提案手法は,いくつかの公開データセットにおいて,最先端の群集カウント法より優れる。
関連論文リスト
- CrowdRec: 3D Crowd Reconstruction from Single Color Images [17.662273473398592]
我々は,群集の特徴を活かし,群集画像に共通する1対1の手法を改善するために,群集制約付き最適化を提案する。
この最適化により、大規模な群集画像から、合理的な絶対位置の正確なボディポーズと形状を得ることができる。
論文 参考訳(メタデータ) (2023-10-10T06:03:39Z) - R-MAE: Regions Meet Masked Autoencoders [113.73147144125385]
我々は、自己教師付き画像表現学習のための単語の潜在的な視覚的類似として領域を探索する。
生成前トレーニングベースラインであるMasked Autoencoding (MAE) に触発されて, 画素群や領域群から学習するためのマスク付き領域オートエンコーディングを提案する。
論文 参考訳(メタデータ) (2023-06-08T17:56:46Z) - Crowd3D: Towards Hundreds of People Reconstruction from a Single Image [57.58149031283827]
我々は,1つの大画面画像から数百人のグローバルな一貫性を持つ人々の3Dポーズ,形状,位置を再構築する最初のフレームワークであるCrowd3Dを提案する。
多数の人やさまざまな人体サイズに対応するため,適応型人間中心収穫方式を設計する。
論文 参考訳(メタデータ) (2023-01-23T11:45:27Z) - Scene-Adaptive Attention Network for Crowd Counting [31.29858034122248]
本稿では,シーン適応型アテンションネットワークであるSAANetを提案する。
本研究では,変形可能なサンプリング位置と動的注意重みを持つ適応的特徴表現を学習するトランスフォーマーバックボーンの設計を行う。
我々は,4つの挑戦的群集カウントベンチマークについて広範な実験を行い,その手法が最先端のパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-12-31T15:03:17Z) - Fine-Grained Crowd Counting [59.63412475367119]
現在の群衆カウントアルゴリズムは、画像内の人の数にのみ関係している。
本研究では,各個体の低レベル行動特性に基づいて,群集をカテゴリに分類する,きめ細かい群集カウントを提案する。
論文 参考訳(メタデータ) (2020-07-13T01:31:12Z) - Shallow Feature Based Dense Attention Network for Crowd Counting [103.67446852449551]
静止画像から群衆を数えるためのShallow機能に基づくDense Attention Network (SDANet)を提案する。
提案手法は,SDANetの11.9%の平均絶対誤差(MAE)低下から明らかなように,既存の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2020-06-17T13:34:42Z) - Over-crowdedness Alert! Forecasting the Future Crowd Distribution [87.12694319017346]
提案手法は,クラウドビデオの逐次的フレームを識別アノテーションを使わずに,近い将来に群衆の分布を予測することを目的として,新しい群集解析問題を定式化したものである。
この問題を解決するために, 連続する群集映像フレームを入力とし, 対応する密度マップを補助情報として利用するグローバルな2ストリームリカレントネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T08:59:54Z) - Relevant Region Prediction for Crowd Counting [43.85415960107145]
クラウドカウントのための関連領域予測(RRP)を提案する。
RRP は Count Map と Region Relation-Aware Module (RRAM) から構成される
グラフ畳み込みネットワーク(GCN)に基づいて、重要な領域依存を捕捉して活用するために、リージョン関係認識モジュールが提案されている。
論文 参考訳(メタデータ) (2020-05-20T01:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。