論文の概要: HDNet: A Hierarchically Decoupled Network for Crowd Counting
- arxiv url: http://arxiv.org/abs/2212.05722v1
- Date: Mon, 12 Dec 2022 06:01:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 16:46:56.745133
- Title: HDNet: A Hierarchically Decoupled Network for Crowd Counting
- Title(参考訳): hdnet:群衆数を階層的に分離したネットワーク
- Authors: Chenliang Gu, Changan Wang, Bin-Bin Gao, Jun Liu, Tianliang Zhang
- Abstract要約: 本稿では,階層型分離ネットワーク(HDNet)を提案する。
HDNetは、いくつかの人気のあるカウントベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 11.530565995318696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, density map regression-based methods have dominated in crowd
counting owing to their excellent fitting ability on density distribution.
However, further improvement tends to saturate mainly because of the confusing
background noise and the large density variation. In this paper, we propose a
Hierarchically Decoupled Network (HDNet) to solve the above two problems within
a unified framework. Specifically, a background classification sub-task is
decomposed from the density map prediction task, which is then assigned to a
Density Decoupling Module (DDM) to exploit its highly discriminative ability.
For the remaining foreground prediction sub-task, it is further hierarchically
decomposed to several density-specific sub-tasks by the DDM, which are then
solved by the regression-based experts in a Foreground Density Estimation
Module (FDEM). Although the proposed strategy effectively reduces the
hypothesis space so as to relieve the optimization for those task-specific
experts, the high correlation of these sub-tasks are ignored. Therefore, we
introduce three types of interaction strategies to unify the whole framework,
which are Feature Interaction, Gradient Interaction, and Scale Interaction.
Integrated with the above spirits, HDNet achieves state-of-the-art performance
on several popular counting benchmarks.
- Abstract(参考訳): 近年,密度分布の適合性が高いため,密度マップ回帰に基づく手法が群集計数において優勢である。
しかし、背景雑音と大きな密度変化が主な原因で、さらなる改善は飽和する傾向にある。
本稿では,上記の2つの問題を解決するための階層的分離ネットワーク(hdnet)を提案する。
具体的には、背景分類サブタスクを密度マップ予測タスクから分解し、密度デカップリングモジュール(DDM)に割り当てられ、その高い識別能力を利用する。
残りのフォアグラウンド予測サブタスクでは、ddmによって複数の密度特異的サブタスクに階層的に分解され、フォアグラウンド密度推定モジュール(fdem)で回帰ベースの専門家によって解決される。
提案手法は,これらのタスク固有の専門家の最適化を緩和するために仮説空間を効果的に削減するが,これらのサブタスクの高相関は無視される。
そこで我々は,機能インタラクション,勾配インタラクション,スケールインタラクションという,フレームワーク全体を統一するための3種類のインタラクション戦略を導入する。
上記の精神と統合されたHDNetは、いくつかの人気のあるカウントベンチマークで最先端のパフォーマンスを達成する。
関連論文リスト
- Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Semi-supervised Crowd Counting via Density Agency [57.3635501421658]
我々は、学習可能な補助構造、すなわち密度エージェンシーを構築し、認識された前景の地域特徴を対応する密度サブクラスに近づける。
第2に,バックボーン特徴抽出器を統合するために,密度誘導型コントラスト学習損失を提案する。
第3に,前景の機能を改良するためにトランス構造を用いて回帰ヘッドを構築する。
論文 参考訳(メタデータ) (2022-09-07T06:34:00Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。