論文の概要: Hybrid attention network based on progressive embedding scale-context
for crowd counting
- arxiv url: http://arxiv.org/abs/2106.02324v1
- Date: Fri, 4 Jun 2021 08:10:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 15:02:47.442873
- Title: Hybrid attention network based on progressive embedding scale-context
for crowd counting
- Title(参考訳): 群集カウントのためのプログレッシブ埋め込みスケールコンテキストに基づくハイブリットアテンションネットワーク
- Authors: Fusen Wang and Jun Sang and Zhongyuan Wu and Qi Liu and Nong Sang
- Abstract要約: 本稿では,PES(Progressive Embedding Scale-Context)情報を利用したハイブリッド注意ネットワークを提案する。
我々は、空間的注意とチャネル的注意モジュールを並列化することで、ハイブリッドな注意機構を構築する。
PES情報により、ネットワークはノイズを同時に抑制し、ヘッドスケールの変動を適応させることができる。
- 参考スコア(独自算出の注目度): 25.866856497266884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The existing crowd counting methods usually adopted attention mechanism to
tackle background noise, or applied multi-level features or multi-scales
context fusion to tackle scale variation. However, these approaches deal with
these two problems separately. In this paper, we propose a Hybrid Attention
Network (HAN) by employing Progressive Embedding Scale-context (PES)
information, which enables the network to simultaneously suppress noise and
adapt head scale variation. We build the hybrid attention mechanism through
paralleling spatial attention and channel attention module, which makes the
network to focus more on the human head area and reduce the interference of
background objects. Besides, we embed certain scale-context to the hybrid
attention along the spatial and channel dimensions for alleviating these
counting errors caused by the variation of perspective and head scale. Finally,
we propose a progressive learning strategy through cascading multiple hybrid
attention modules with embedding different scale-context, which can gradually
integrate different scale-context information into the current feature map from
global to local. Ablation experiments provides that the network architecture
can gradually learn multi-scale features and suppress background noise.
Extensive experiments demonstrate that HANet obtain state-of-the-art counting
performance on four mainstream datasets.
- Abstract(参考訳): 既存の群集カウント法では、バックグラウンドノイズに対処するためのアテンションメカニズムや、スケール変動に対処するためのマルチレベル特徴やマルチスケールコンテキスト融合が採用されている。
しかし、これらのアプローチは2つの問題を別々に扱う。
本稿では,音の抑制と頭部スケール変化の適応を同時に行うための,progressive embedded scale-context (pes) 情報を用いたハイブリッドアテンションネットワーク (han) を提案する。
本研究では,空間的注意とチャネル的注意モジュールの並列化によるハイブリットアテンション機構を構築し,ネットワークが人間の頭部領域に集中し,背景物体の干渉を低減する。
さらに,空間的およびチャネル的次元に沿ったハイブリッドな注意に一定のスケールコンテキストを組み込むことにより,視点や頭部規模の変化による計数誤差を軽減する。
最後に,複数のハイブリッドアテンションモジュールに異なるスケールコンテキストを組み込むことによって,グローバルからローカルまでの現在の機能マップに,スケールコンテキスト情報を段階的に統合する,プログレッシブ学習戦略を提案する。
アブレーション実験により、ネットワークアーキテクチャは徐々にマルチスケールの特徴を学習し、バックグラウンドノイズを抑制することができる。
大規模な実験により、HANetは4つの主流データセットで最先端のカウント性能を得ることができた。
関連論文リスト
- Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - Multi-scale Adaptive Fusion Network for Hyperspectral Image Denoising [35.491878332394265]
マルチスケール・アダプティブ・フュージョン・ネットワーク(MAFNet)を用いたHSI復調手法を提案する。
提案したMAFNetは、他の最先端技術よりも性能が向上している。
論文 参考訳(メタデータ) (2023-04-19T02:00:21Z) - Boosting Crowd Counting via Multifaceted Attention [109.89185492364386]
大規模なバリエーションは、しばしば群衆画像の中に存在する。
CNNの固定サイズ畳み込みカーネルも、最近の視覚変換器の固定サイズアテンションも、このような変動には対処できない。
局所空間関係符号化におけるトランスフォーマーモデルを改善するための多面的注意ネットワーク(MAN)を提案する。
論文 参考訳(メタデータ) (2022-03-05T01:36:43Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - Multi-View Stereo Network with attention thin volume [0.0]
複数のRGB画像から深度値を推定するための効率的なマルチビューステレオ(MVS)ネットワークを提案する。
入力画像から支配的な情報を完全に集約する自己認識機構を導入する。
また,特徴集約に対するグループワイド相関を導入し,メモリと計算負荷を大幅に削減する。
論文 参考訳(メタデータ) (2021-10-16T11:51:23Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。