論文の概要: Multi-Level Attentive Convoluntional Neural Network for Crowd Counting
- arxiv url: http://arxiv.org/abs/2105.11422v1
- Date: Mon, 24 May 2021 17:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 17:02:22.627461
- Title: Multi-Level Attentive Convoluntional Neural Network for Crowd Counting
- Title(参考訳): 集団計数のための多層注意神経回路網
- Authors: Mengxiao Tian, Hao Guo, Chengjiang Long
- Abstract要約: クラウドカウントのためのマルチレベル注意型畳み込みニューラルネットワーク(MLAttnCNN)を提案する。
我々は、複数の異なるスケールをプールに適用した高レベルの文脈情報を抽出する。
マルチレベルアテンションモジュールを用いて、異なる層の特徴を豊かにし、より効率的なマルチスケール機能融合を実現する。
- 参考スコア(独自算出の注目度): 12.61997540961144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently the crowd counting has received more and more attention. Especially
the technology of high-density environment has become an important research
content, and the relevant methods for the existence of extremely dense crowd
are not optimal. In this paper, we propose a multi-level attentive
Convolutional Neural Network (MLAttnCNN) for crowd counting. We extract
high-level contextual information with multiple different scales applied in
pooling, and use multi-level attention modules to enrich the characteristics at
different layers to achieve more efficient multi-scale feature fusion, which is
able to be used to generate a more accurate density map with dilated
convolutions and a $1\times 1$ convolution. The extensive experiments on three
available public datasets show that our proposed network achieves
outperformance to the state-of-the-art approaches.
- Abstract(参考訳): 最近、群衆のカウントはますます注目を浴びている。
特に高密度環境の技術は重要な研究内容となり,高濃度の群集が存在するための適切な手法は最適ではない。
本稿では,クラウドカウントのためのマルチレベル注意型畳み込みニューラルネットワーク(MLAttnCNN)を提案する。
我々は、複数の異なるスケールをプールに応用した高レベルのコンテキスト情報を抽出し、多層アテンションモジュールを用いて異なる層の特徴を強化し、より効率的なマルチスケール特徴融合を実現し、拡張畳み込みと1ドル1セントの畳み込みでより正確な密度マップを生成することができる。
利用可能な3つの公開データセットに関する広範な実験により、提案したネットワークは最先端のアプローチに優れた性能を発揮することが示された。
関連論文リスト
- Scalable Multi-view Clustering via Explicit Kernel Features Maps [20.610589722626074]
マルチビュー学習に対する意識の高まりは、現実世界のアプリケーションにおける複数のビューの増加によるものだ。
優れたクラスタリング性能を維持しつつ,計算負担を軽減するため,カーネル特徴マップを活用した効率的な最適化手法を提案する。
我々は,最先端のマルチビューサブスペースクラスタリング手法や属性ネットワークのマルチビューアプローチに対して,アルゴリズムの性能を評価するために,様々な規模の実世界のベンチマークネットワーク上で広範囲に実験を行った。
論文 参考訳(メタデータ) (2024-02-07T12:35:31Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - Crowd counting with segmentation attention convolutional neural network [20.315829094519128]
我々はSegCrowdNetと呼ばれる新しい畳み込みニューラルネットワークアーキテクチャを提案する。
SegCrowdNetは人間の頭領域を適応的に強調し、セグメント化によって非頭領域を抑圧する。
SegCrowdNetは最先端のメソッドと比較して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-04-15T08:40:38Z) - Routing with Self-Attention for Multimodal Capsule Networks [108.85007719132618]
我々は,カプセルの強度をマルチモーダル学習フレームワークの文脈で活用できる,新しいマルチモーダルカプセルネットワークを提案する。
カプセルを大規模入力データに適応させるために, カプセルを選択する自己保持機構による新たなルーティングを提案する。
これにより、ノイズの多いビデオデータによる堅牢なトレーニングだけでなく、従来のルーティング方法と比較してカプセルネットワークのサイズを拡大することが可能になる。
論文 参考訳(メタデータ) (2021-12-01T19:01:26Z) - Multi-scale Matching Networks for Semantic Correspondence [38.904735120815346]
提案手法は,高い計算効率を有する3つの一般的なベンチマークに対して,最先端の性能を実現する。
我々のマルチスケールマッチングネットワークは、学習可能なパラメータをほとんど必要とせずに、エンドツーエンドで簡単に訓練できる。
論文 参考訳(メタデータ) (2021-07-31T10:57:24Z) - Multi-Scale Context Aggregation Network with Attention-Guided for Crowd
Counting [23.336181341124746]
群衆カウントは、人の数を予測し、画像内の密度マップを生成することを目的としている。
さまざまなヘッドスケール、画像間の群衆分布の多様性、散らかった背景など、多くの課題がある。
本稿では,クラウドカウントのための単一カラムエンコーダ・デコーダアーキテクチャに基づくマルチスケールコンテキストアグリゲーションネットワーク(mscanet)を提案する。
論文 参考訳(メタデータ) (2021-04-06T02:24:06Z) - Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT
Benchmark for Crowd Counting [109.32927895352685]
RGBT Crowd Counting (RGBT-CC) ベンチマークは2,030対のRGB熱画像と138,389人の注釈付き画像を含む。
マルチモーダルな群集カウントを容易にするために,クロスモーダルな協調表現学習フレームワークを提案する。
RGBT-CCベンチマークで行った実験は、RGBTの群集カウントにおけるフレームワークの有効性を示した。
論文 参考訳(メタデータ) (2020-12-08T16:18:29Z) - Recursive Multi-model Complementary Deep Fusion forRobust Salient Object
Detection via Parallel Sub Networks [62.26677215668959]
完全畳み込みネットワークは、正体検出(SOD)分野において優れた性能を示している。
本稿では,全く異なるネットワークアーキテクチャを持つ並列サブネットワークからなる,より広いネットワークアーキテクチャを提案する。
いくつかの有名なベンチマークの実験では、提案されたより広範なフレームワークの優れた性能、優れた一般化、強力な学習能力が明らかに示されている。
論文 参考訳(メタデータ) (2020-08-07T10:39:11Z) - Shallow Feature Based Dense Attention Network for Crowd Counting [103.67446852449551]
静止画像から群衆を数えるためのShallow機能に基づくDense Attention Network (SDANet)を提案する。
提案手法は,SDANetの11.9%の平均絶対誤差(MAE)低下から明らかなように,既存の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2020-06-17T13:34:42Z) - Unpaired Multi-modal Segmentation via Knowledge Distillation [77.39798870702174]
本稿では,不対向画像分割のための新しい学習手法を提案する。
提案手法では,CTおよびMRI間での畳み込みカーネルの共有により,ネットワークパラメータを多用する。
我々は2つの多クラスセグメンテーション問題に対するアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2020-01-06T20:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。