論文の概要: STNet: Scale Tree Network with Multi-level Auxiliator for Crowd Counting
- arxiv url: http://arxiv.org/abs/2012.10189v1
- Date: Fri, 18 Dec 2020 12:18:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:25:23.081316
- Title: STNet: Scale Tree Network with Multi-level Auxiliator for Crowd Counting
- Title(参考訳): stnet: クラウドカウントのためのマルチレベルアクシリエータを備えたスケールツリーネットワーク
- Authors: Mingjie Wang, Hao Cai, Xianfeng Han, Jun Zhou, Minglun Gong
- Abstract要約: スケールのばらつき、密度の不整合、複雑な背景のため、群衆のカウントは依然として難しい課題である。
スケールツリーネットワーク(STNet)と呼ばれる新しい強力なネットワークを提案し、正確なクラウドカウントを行います。
STNetは、Scale-Tree Diversity EnhancerとSemi-supervised Multi-level Auxiliatorの2つの重要なコンポーネントで構成されている。
- 参考スコア(独自算出の注目度): 21.948281912230534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting remains a challenging task because the presence of drastic
scale variation, density inconsistency, and complex background can seriously
degrade the counting accuracy. To battle the ingrained issue of accuracy
degradation, we propose a novel and powerful network called Scale Tree Network
(STNet) for accurate crowd counting. STNet consists of two key components: a
Scale-Tree Diversity Enhancer and a Semi-supervised Multi-level Auxiliator.
Specifically, the Diversity Enhancer is designed to enrich scale diversity,
which alleviates limitations of existing methods caused by insufficient level
of scales. A novel tree structure is adopted to hierarchically parse
coarse-to-fine crowd regions. Furthermore, a simple yet effective Multi-level
Auxiliator is presented to aid in exploiting generalisable shared
characteristics at multiple levels, allowing more accurate pixel-wise
background cognition. The overall STNet is trained in an end-to-end manner,
without the needs for manually tuning loss weights between the main and the
auxiliary tasks. Extensive experiments on four challenging crowd datasets
demonstrate the superiority of the proposed method.
- Abstract(参考訳): 大規模なスケールの変動、密度の不整合、複雑なバックグラウンドの存在は、カウントの精度を著しく低下させる可能性があるため、群衆カウントは依然として難しい課題である。
そこで本研究では, 精度低下問題に対処するために, スケールツリーネットワーク (stnet) と呼ばれる新しい強力なネットワークを提案する。
STNetは、Scale-Tree Diversity EnhancerとSemi-supervised Multi-level Auxiliatorの2つの重要なコンポーネントで構成されている。
具体的には、ダイバーシティエンハンサーは、スケールのレベル不足による既存の方法の制限を緩和する、スケールの多様性を強化するように設計されている。
階層的に粗大な群集領域を解析する新しい木構造を採用する。
さらに,複数レベルの共通特性を利用して,より正確な背景認識を実現するため,単純で効果的なマルチレベル補助器を提案する。
stnet全体は、メインタスクと補助タスクの間の損失重みを手動でチューニングする必要なしに、エンドツーエンドでトレーニングされる。
4つの挑戦的な群集データセットに対する大規模な実験により,提案手法の優位性を示した。
関連論文リスト
- Scale Equalization for Multi-Level Feature Fusion [8.541075075344438]
並列ブランチのマルチレベル機能は、異なるスケールにあることが分かりました。
スケール不均衡は普遍的かつ望ましくない欠陥であり、有害な勾配降下を引き起こす。
両線形アップサンプリング後のマルチレベル特徴量間でのスケール平衡を実現するために, スケール等化器の注入を提案する。
論文 参考訳(メタデータ) (2024-02-02T05:25:51Z) - STEERER: Resolving Scale Variations for Counting and Localization via
Selective Inheritance Learning [74.2343877907438]
スケールの変動はオブジェクトカウントにおける根深い問題であり、既存のスケールアウェアアルゴリズムでは効果的に対処されていない。
本稿では,オブジェクトカウントにおけるスケール変動の問題に対処する,STEERERと呼ばれる新しい手法を提案する。
STEERERは、特徴抽出を促進するために、パッチオブジェクトに最も適したスケールを選択し、下位から上位までの識別的特徴のみを徐々に継承する。
論文 参考訳(メタデータ) (2023-08-21T05:09:07Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - Crowd counting with segmentation attention convolutional neural network [20.315829094519128]
我々はSegCrowdNetと呼ばれる新しい畳み込みニューラルネットワークアーキテクチャを提案する。
SegCrowdNetは人間の頭領域を適応的に強調し、セグメント化によって非頭領域を抑圧する。
SegCrowdNetは最先端のメソッドと比較して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-04-15T08:40:38Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Multi-Level Attentive Convoluntional Neural Network for Crowd Counting [12.61997540961144]
クラウドカウントのためのマルチレベル注意型畳み込みニューラルネットワーク(MLAttnCNN)を提案する。
我々は、複数の異なるスケールをプールに適用した高レベルの文脈情報を抽出する。
マルチレベルアテンションモジュールを用いて、異なる層の特徴を豊かにし、より効率的なマルチスケール機能融合を実現する。
論文 参考訳(メタデータ) (2021-05-24T17:29:00Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。