論文の概要: STNet: Scale Tree Network with Multi-level Auxiliator for Crowd Counting
- arxiv url: http://arxiv.org/abs/2012.10189v1
- Date: Fri, 18 Dec 2020 12:18:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:25:23.081316
- Title: STNet: Scale Tree Network with Multi-level Auxiliator for Crowd Counting
- Title(参考訳): stnet: クラウドカウントのためのマルチレベルアクシリエータを備えたスケールツリーネットワーク
- Authors: Mingjie Wang, Hao Cai, Xianfeng Han, Jun Zhou, Minglun Gong
- Abstract要約: スケールのばらつき、密度の不整合、複雑な背景のため、群衆のカウントは依然として難しい課題である。
スケールツリーネットワーク(STNet)と呼ばれる新しい強力なネットワークを提案し、正確なクラウドカウントを行います。
STNetは、Scale-Tree Diversity EnhancerとSemi-supervised Multi-level Auxiliatorの2つの重要なコンポーネントで構成されている。
- 参考スコア(独自算出の注目度): 21.948281912230534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting remains a challenging task because the presence of drastic
scale variation, density inconsistency, and complex background can seriously
degrade the counting accuracy. To battle the ingrained issue of accuracy
degradation, we propose a novel and powerful network called Scale Tree Network
(STNet) for accurate crowd counting. STNet consists of two key components: a
Scale-Tree Diversity Enhancer and a Semi-supervised Multi-level Auxiliator.
Specifically, the Diversity Enhancer is designed to enrich scale diversity,
which alleviates limitations of existing methods caused by insufficient level
of scales. A novel tree structure is adopted to hierarchically parse
coarse-to-fine crowd regions. Furthermore, a simple yet effective Multi-level
Auxiliator is presented to aid in exploiting generalisable shared
characteristics at multiple levels, allowing more accurate pixel-wise
background cognition. The overall STNet is trained in an end-to-end manner,
without the needs for manually tuning loss weights between the main and the
auxiliary tasks. Extensive experiments on four challenging crowd datasets
demonstrate the superiority of the proposed method.
- Abstract(参考訳): 大規模なスケールの変動、密度の不整合、複雑なバックグラウンドの存在は、カウントの精度を著しく低下させる可能性があるため、群衆カウントは依然として難しい課題である。
そこで本研究では, 精度低下問題に対処するために, スケールツリーネットワーク (stnet) と呼ばれる新しい強力なネットワークを提案する。
STNetは、Scale-Tree Diversity EnhancerとSemi-supervised Multi-level Auxiliatorの2つの重要なコンポーネントで構成されている。
具体的には、ダイバーシティエンハンサーは、スケールのレベル不足による既存の方法の制限を緩和する、スケールの多様性を強化するように設計されている。
階層的に粗大な群集領域を解析する新しい木構造を採用する。
さらに,複数レベルの共通特性を利用して,より正確な背景認識を実現するため,単純で効果的なマルチレベル補助器を提案する。
stnet全体は、メインタスクと補助タスクの間の損失重みを手動でチューニングする必要なしに、エンドツーエンドでトレーニングされる。
4つの挑戦的な群集データセットに対する大規模な実験により,提案手法の優位性を示した。
関連論文リスト
- Crowd counting with segmentation attention convolutional neural network [20.315829094519128]
我々はSegCrowdNetと呼ばれる新しい畳み込みニューラルネットワークアーキテクチャを提案する。
SegCrowdNetは人間の頭領域を適応的に強調し、セグメント化によって非頭領域を抑圧する。
SegCrowdNetは最先端のメソッドと比較して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-04-15T08:40:38Z) - Balancing Generalization and Specialization in Zero-shot Learning [80.7530875747194]
両機能を利用するために,BGSNetと呼ばれる共通化と能力のバランスの取れたエンドツーエンドネットワークを提案する。
新たな自己調整型多様性損失は、冗長性の低減と多様性の向上により、BSNetを最適化するように設計されている。
4つのベンチマークデータセットの実験は、我々のモデルの有効性を示している。
論文 参考訳(メタデータ) (2022-01-06T08:04:27Z) - Cluster-Promoting Quantization with Bit-Drop for Minimizing Network
Quantization Loss [61.26793005355441]
クラスタ・プロモーティング・量子化(CPQ)は、ニューラルネットワークに最適な量子化グリッドを見つける。
DropBitsは、ニューロンの代わりにランダムにビットをドロップする標準のドロップアウト正規化を改訂する新しいビットドロップ技術である。
本手法を様々なベンチマークデータセットとネットワークアーキテクチャ上で実験的に検証する。
論文 参考訳(メタデータ) (2021-09-05T15:15:07Z) - Semi-supervised Network Embedding with Differentiable Deep Quantisation [81.49184987430333]
我々はネットワーク埋め込みのための微分可能な量子化法であるd-SNEQを開発した。
d-SNEQは、学習された量子化符号にリッチな高次情報を与えるためにランク損失を組み込む。
トレーニング済みの埋め込みのサイズを大幅に圧縮できるため、ストレージのフットプリントが減少し、検索速度が向上する。
論文 参考訳(メタデータ) (2021-08-20T11:53:05Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Multi-Level Attentive Convoluntional Neural Network for Crowd Counting [12.61997540961144]
クラウドカウントのためのマルチレベル注意型畳み込みニューラルネットワーク(MLAttnCNN)を提案する。
我々は、複数の異なるスケールをプールに適用した高レベルの文脈情報を抽出する。
マルチレベルアテンションモジュールを用いて、異なる層の特徴を豊かにし、より効率的なマルチスケール機能融合を実現する。
論文 参考訳(メタデータ) (2021-05-24T17:29:00Z) - Differentiable Multi-Granularity Human Representation Learning for
Instance-Aware Human Semantic Parsing [131.97475877877608]
カテゴリーレベルの人間のセマンティックセグメンテーションとマルチパーソンポーズ推定を共同およびエンドツーエンドで学習するために,新たなボトムアップ方式を提案する。
さまざまな人間の粒度にわたって構造情報を利用する、コンパクトで効率的で強力なフレームワークです。
3つのインスタンス認識型ヒューマンデータセットの実験は、我々のモデルがより効率的な推論で他のボトムアップの代替案よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-03-08T06:55:00Z) - Scale-Aware Network with Regional and Semantic Attentions for Crowd
Counting under Cluttered Background [7.108205342578417]
本稿では,地域的,意味的に注意を向けるスケールアウェア群数ネットワーク(saccn)を提案する。
提案するsaccnは,地域的・意味的自己照査機構を適用し,群衆と背景を区別する。
すべてのコードと事前トレーニングされたモデルはすぐにリリースされる。
論文 参考訳(メタデータ) (2021-01-05T12:20:10Z) - Neural Pruning via Growing Regularization [82.9322109208353]
プルーニングの2つの中心的な問題:プルーニングのスケジュールと重み付けの重要度だ。
具体的には, ペナルティ要因が増大するL2正規化変種を提案し, 精度が著しく向上することを示した。
提案アルゴリズムは,構造化プルーニングと非構造化プルーニングの両方において,大規模データセットとネットワークの実装が容易かつスケーラブルである。
論文 参考訳(メタデータ) (2020-12-16T20:16:28Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。