論文の概要: Crowd Counting via Hierarchical Scale Recalibration Network
- arxiv url: http://arxiv.org/abs/2003.03545v1
- Date: Sat, 7 Mar 2020 10:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 19:47:59.586522
- Title: Crowd Counting via Hierarchical Scale Recalibration Network
- Title(参考訳): 階層的規模再校正ネットワークによる集団カウント
- Authors: Zhikang Zou and Yifan Liu and Shuangjie Xu and Wei Wei and Shiping Wen
and Pan Zhou
- Abstract要約: 本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
- 参考スコア(独自算出の注目度): 61.09833400167511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of crowd counting is extremely challenging due to complicated
difficulties, especially the huge variation in vision scale. Previous works
tend to adopt a naive concatenation of multi-scale information to tackle it,
while the scale shifts between the feature maps are ignored. In this paper, we
propose a novel Hierarchical Scale Recalibration Network (HSRNet), which
addresses the above issues by modeling rich contextual dependencies and
recalibrating multiple scale-associated information. Specifically, a Scale
Focus Module (SFM) first integrates global context into local features by
modeling the semantic inter-dependencies along channel and spatial dimensions
sequentially. In order to reallocate channel-wise feature responses, a Scale
Recalibration Module (SRM) adopts a step-by-step fusion to generate final
density maps. Furthermore, we propose a novel Scale Consistency loss to
constrain that the scale-associated outputs are coherent with groundtruth of
different scales. With the proposed modules, our approach can ignore various
noises selectively and focus on appropriate crowd scales automatically.
Extensive experiments on crowd counting datasets (ShanghaiTech, MALL,
WorldEXPO'10, and UCSD) show that our HSRNet can deliver superior results over
all state-of-the-art approaches. More remarkably, we extend experiments on an
extra vehicle dataset, whose results indicate that the proposed model is
generalized to other applications.
- Abstract(参考訳): 群集カウントの課題は、複雑な困難、特に視覚スケールの大きな変化のために非常に難しい。
これまでの作業では,機能マップ間のスケールシフトが無視される一方で,マルチスケール情報の単純な結合が採用されていた。
本稿では,リッチなコンテキスト依存をモデル化し,複数のスケール関連情報を再構成することで,上記の問題に対処する階層型階層型リカバリネットワーク(HSRNet)を提案する。
特に、スケールフォーカスモジュール(sfm)は、チャネルと空間の次元に沿って意味的相互依存性を逐次モデル化することで、まずグローバルコンテキストをローカル機能に統合する。
SRM(Scale Recalibration Module)は、チャネルワイドな特徴応答を再配置するために、ステップバイステップの融合を採用して最終的な密度マップを生成する。
さらに、スケール関連出力が異なるスケールの基底と一貫性を持つことを制約する新しいスケール一貫性損失を提案する。
提案手法では,様々なノイズを選択的に無視し,適切な群集規模に自動的に注目することができる。
クラウドカウンティングデータセット(shanghaitech, mall, worldexpo'10, ucsd)に関する広範な実験によって、私たちのhsrnetは最先端のアプローチで優れた結果を提供できることが分かりました。
さらに顕著なことに,提案モデルが他のアプリケーションに一般化されていることを示す,車外データセットの実験を拡張した。
関連論文リスト
- Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - STEERER: Resolving Scale Variations for Counting and Localization via
Selective Inheritance Learning [74.2343877907438]
スケールの変動はオブジェクトカウントにおける根深い問題であり、既存のスケールアウェアアルゴリズムでは効果的に対処されていない。
本稿では,オブジェクトカウントにおけるスケール変動の問題に対処する,STEERERと呼ばれる新しい手法を提案する。
STEERERは、特徴抽出を促進するために、パッチオブジェクトに最も適したスケールを選択し、下位から上位までの識別的特徴のみを徐々に継承する。
論文 参考訳(メタデータ) (2023-08-21T05:09:07Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Scale-Aware Dynamic Network for Continuous-Scale Super-Resolution [16.67263192454279]
連続的スケールSRのためのSADN(Scale-Aware dynamic network)を提案する。
まず、複数のSRタスクを様々なスケールで特徴学習するためのSAD-Conv層を提案する。
第2に,マルチ双線形局所暗黙関数 (MBLIF) を付加した連続スケールアップサンプリングモジュール (CSUM) を考案した。
論文 参考訳(メタデータ) (2021-10-29T09:57:48Z) - Multi-View Stereo Network with attention thin volume [0.0]
複数のRGB画像から深度値を推定するための効率的なマルチビューステレオ(MVS)ネットワークを提案する。
入力画像から支配的な情報を完全に集約する自己認識機構を導入する。
また,特徴集約に対するグループワイド相関を導入し,メモリと計算負荷を大幅に削減する。
論文 参考訳(メタデータ) (2021-10-16T11:51:23Z) - Hybrid attention network based on progressive embedding scale-context
for crowd counting [25.866856497266884]
本稿では,PES(Progressive Embedding Scale-Context)情報を利用したハイブリッド注意ネットワークを提案する。
我々は、空間的注意とチャネル的注意モジュールを並列化することで、ハイブリッドな注意機構を構築する。
PES情報により、ネットワークはノイズを同時に抑制し、ヘッドスケールの変動を適応させることができる。
論文 参考訳(メタデータ) (2021-06-04T08:10:21Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - Joint Self-Attention and Scale-Aggregation for Self-Calibrated Deraining
Network [13.628218953897946]
本稿では,JDNetとよばれる有効アルゴリズムを提案する。
自己校正畳み込みを用いたスケール・アグリゲーション・セルフアグリゲーション・モジュールを巧みに設計することにより,提案モデルはより優れたデコレーション結果が得られる。
論文 参考訳(メタデータ) (2020-08-06T17:04:34Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。