論文の概要: Coarse- and Fine-grained Attention Network with Background-aware Loss
for Crowd Density Map Estimation
- arxiv url: http://arxiv.org/abs/2011.03721v1
- Date: Sat, 7 Nov 2020 08:05:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 22:16:42.940553
- Title: Coarse- and Fine-grained Attention Network with Background-aware Loss
for Crowd Density Map Estimation
- Title(参考訳): 集団密度マップ推定のための背景認識損失を有する粗大・きめの注意ネットワーク
- Authors: Liangzi Rong, Chunping Li
- Abstract要約: CFANetは、高品質な群衆密度マップを生成する新しい方法であり、人を数える。
集合領域認識器 (CRR) と密度レベル推定器 (DLE) を結合して, 粗大から細大に進行する注意機構を考案する。
提案手法は,従来の最先端手法をカウント精度で上回るだけでなく,密度マップの画質の向上や,誤認識率の低減にも寄与する。
- 参考スコア(独自算出の注目度): 2.690502103971799
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a novel method Coarse- and Fine-grained Attention
Network (CFANet) for generating high-quality crowd density maps and people
count estimation by incorporating attention maps to better focus on the crowd
area. We devise a from-coarse-to-fine progressive attention mechanism by
integrating Crowd Region Recognizer (CRR) and Density Level Estimator (DLE)
branch, which can suppress the influence of irrelevant background and assign
attention weights according to the crowd density levels, because generating
accurate fine-grained attention maps directly is normally difficult. We also
employ a multi-level supervision mechanism to assist the backpropagation of
gradient and reduce overfitting. Besides, we propose a Background-aware
Structural Loss (BSL) to reduce the false recognition ratio while improving the
structural similarity to groundtruth. Extensive experiments on commonly used
datasets show that our method can not only outperform previous state-of-the-art
methods in terms of count accuracy but also improve the image quality of
density maps as well as reduce the false recognition ratio.
- Abstract(参考訳): 本稿では,高品質な群集密度マップを生成するためのCFANet(Coarse- and Fine-fine Attention Network)を提案する。
集団領域認識器 (CRR) と密度レベル推定器 (DLE) を一体化することにより, 集団密度レベルに応じて無関係な背景の影響を抑え, 注意重みを割り当てる, 正確な微粒な注意図を生成することが通常困難である。
また,グラデーションのバックプロパゲーションと過剰フィッティングの低減を支援するマルチレベル監視機構も採用している。
また, 地盤との構造的類似性を改善しつつ, 誤認識率を低減させる背景認識構造損失(bsl)を提案する。
一般用データセットに対する大規模な実験により,提案手法は従来手法よりも精度が向上するだけでなく,密度マップの画質向上や誤認識率の低減が図られている。
関連論文リスト
- Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Semi-supervised Crowd Counting via Density Agency [57.3635501421658]
我々は、学習可能な補助構造、すなわち密度エージェンシーを構築し、認識された前景の地域特徴を対応する密度サブクラスに近づける。
第2に,バックボーン特徴抽出器を統合するために,密度誘導型コントラスト学習損失を提案する。
第3に,前景の機能を改良するためにトランス構造を用いて回帰ヘッドを構築する。
論文 参考訳(メタデータ) (2022-09-07T06:34:00Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - In-sample Contrastive Learning and Consistent Attention for Weakly
Supervised Object Localization [18.971497314227275]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの監視のみを使用して対象オブジェクトをローカライズすることを目的としている。
最近の手法は、最も識別性の高い部分を落として、オブジェクト全体の特徴マップを活性化することをモデルに推奨している。
我々は背景を,高度な対象領域をカバーするために機能活性化を導く重要な手がかりとみなす。
論文 参考訳(メタデータ) (2020-09-25T07:24:46Z) - Recurrent Distillation based Crowd Counting [23.4315417286694]
本稿では,様々な混み合った場面で最先端のパフォーマンスを達成できる,シンプルで効果的な群集カウントフレームワークを提案する。
実験では、提案したトレーニングアルゴリズムにより、単純な畳み込みニューラルネットワークアーキテクチャが強化され、我々のモデルは最先端の手法に匹敵するか、比較できることを示した。
論文 参考訳(メタデータ) (2020-06-14T01:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。