論文の概要: Relevant Region Prediction for Crowd Counting
- arxiv url: http://arxiv.org/abs/2005.09816v1
- Date: Wed, 20 May 2020 01:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 05:41:40.332205
- Title: Relevant Region Prediction for Crowd Counting
- Title(参考訳): 群衆数量の関連する地域予測
- Authors: Xinya Chen, Yanrui Bin, Changxin Gao, Nong Sang, and Hao Tang
- Abstract要約: クラウドカウントのための関連領域予測(RRP)を提案する。
RRP は Count Map と Region Relation-Aware Module (RRAM) から構成される
グラフ畳み込みネットワーク(GCN)に基づいて、重要な領域依存を捕捉して活用するために、リージョン関係認識モジュールが提案されている。
- 参考スコア(独自算出の注目度): 43.85415960107145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting is a concerned and challenging task in computer vision.
Existing density map based methods excessively focus on the individuals'
localization which harms the crowd counting performance in highly congested
scenes. In addition, the dependency between the regions of different density is
also ignored. In this paper, we propose Relevant Region Prediction (RRP) for
crowd counting, which consists of the Count Map and the Region Relation-Aware
Module (RRAM). Each pixel in the count map represents the number of heads
falling into the corresponding local area in the input image, which discards
the detailed spatial information and forces the network pay more attention to
counting rather than localizing individuals. Based on the Graph Convolutional
Network (GCN), Region Relation-Aware Module is proposed to capture and exploit
the important region dependency. The module builds a fully connected directed
graph between the regions of different density where each node (region) is
represented by weighted global pooled feature, and GCN is learned to map this
region graph to a set of relation-aware regions representations. Experimental
results on three datasets show that our method obviously outperforms other
existing state-of-the-art methods.
- Abstract(参考訳): 群衆のカウントはコンピュータビジョンにおいて関心深く挑戦的なタスクである。
既存の密度マップに基づく手法は、密集したシーンにおける群衆カウントのパフォーマンスを損なう個人の位置を過度に重視する。
また、異なる密度の領域間の依存性も無視される。
本稿では,Relevant Region Prediction (RRP) を,Count Map と Region Relation-Aware Module (RRAM) で構成されるクラウドカウントに提案する。
計数マップの各ピクセルは、入力画像内の対応する局所領域に落下する頭部の数を表し、詳細な空間情報を破棄し、ネットワークが個人をローカライズするよりもカウントに注意を払うように強制する。
グラフ畳み込みネットワーク(GCN)に基づいて、重要な領域依存を捕捉して活用するために、リージョン関係認識モジュールを提案する。
モジュールは、各ノード(リージョン)が重み付けされた大域プール特徴によって表現される異なる密度の領域間で完全に連結された有向グラフを構築し、GCNはこの領域グラフを関係対応の領域表現の集合にマッピングすることを学習する。
3つのデータセットにおける実験結果から,本手法が既存の最新手法よりも明らかに優れていることが判明した。
関連論文リスト
- Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Attentive Graph Enhanced Region Representation Learning [7.4106801792345705]
都市部を正確にかつ包括的に表現することは,様々な都市計画・分析業務に不可欠である。
本研究では,複数のグラフから包括的依存関係を抽出し,都市域のリッチな意味表現を学習することを目的としたAttentive Graph Enhanced Region Representation Learning (ATGRL)モデルを提案する。
論文 参考訳(メタデータ) (2023-07-06T16:38:43Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - Urban Region Profiling via A Multi-Graph Representation Learning
Framework [0.0]
本研究では,都市域のプロファイリングのための多グラフ代表学習フレームワークであるRerea2Vecを提案する。
実世界のデータセットの実験によると、Rerea2Vecは3つのアプリケーションで使用でき、最先端のベースラインをすべて上回っている。
論文 参考訳(メタデータ) (2022-02-04T11:05:37Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Cross-Region Building Counting in Satellite Imagery using Counting
Consistency [8.732274235941974]
都市分析、災害管理、公共政策決定に欠かせない要素である。
衛星画像のローカライズとカウントのためのディープラーニング手法は、実現可能で安価な代替手段として機能する。
しかし、これらのアルゴリズムは、訓練されていない領域に適用した場合、性能劣化に悩まされる。
論文 参考訳(メタデータ) (2021-10-26T10:36:56Z) - An attention-driven hierarchical multi-scale representation for visual
recognition [3.3302293148249125]
畳み込みニューラルネットワーク(CNN)は、視覚内容の理解に革命をもたらした。
グラフ畳み込みネットワーク(GCN)を探索することにより,高レベルの長距離依存関係を捕捉する手法を提案する。
本手法は,細粒度と総称的な視覚的分類の両問題を解くのに極めて効果的である。
論文 参考訳(メタデータ) (2021-10-23T09:22:22Z) - Learning Neighborhood Representation from Multi-Modal Multi-Graph:
Image, Text, Mobility Graph and Beyond [20.014906526266795]
本稿では,マルチモーダルジオタグ入力をノードまたはエッジの特徴として統合する新しい手法を提案する。
具体的には、ストリートビュー画像とpoi特徴を用いて、近傍(ノード)を特徴付け、人間移動を用いて近隣(方向エッジ)間の関係を特徴付ける。
トレーニングした埋め込みは、ユニモーダルデータのみを地域入力として使用するものよりも優れています。
論文 参考訳(メタデータ) (2021-05-06T07:44:05Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - LRC-Net: Learning Discriminative Features on Point Clouds by Encoding
Local Region Contexts [65.79931333193016]
本稿では,LRC-Net(Local-Region-Context Network)を提案する。
LRC-Netは、局所領域内および周辺領域間の微粒なコンテキストを同時に符号化する。
その結果, LRC-Netは形状分類や形状分割の応用において最先端の手法と競合することがわかった。
論文 参考訳(メタデータ) (2020-03-18T14:34:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。