論文の概要: Recurrent Distillation based Crowd Counting
- arxiv url: http://arxiv.org/abs/2006.07755v1
- Date: Sun, 14 Jun 2020 01:04:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 13:06:14.398583
- Title: Recurrent Distillation based Crowd Counting
- Title(参考訳): リカレント蒸留に基づく群集計数
- Authors: Yue Gu, Wenxi Liu
- Abstract要約: 本稿では,様々な混み合った場面で最先端のパフォーマンスを達成できる,シンプルで効果的な群集カウントフレームワークを提案する。
実験では、提案したトレーニングアルゴリズムにより、単純な畳み込みニューラルネットワークアーキテクチャが強化され、我々のモデルは最先端の手法に匹敵するか、比較できることを示した。
- 参考スコア(独自算出の注目度): 23.4315417286694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, with the progress of deep learning technologies, crowd
counting has been rapidly developed. In this work, we propose a simple yet
effective crowd counting framework that is able to achieve the state-of-the-art
performance on various crowded scenes. In particular, we first introduce a
perspective-aware density map generation method that is able to produce
ground-truth density maps from point annotations to train crowd counting model
to accomplish superior performance than prior density map generation
techniques. Besides, leveraging our density map generation method, we propose
an iterative distillation algorithm to progressively enhance our model with
identical network structures, without significantly sacrificing the dimension
of the output density maps. In experiments, we demonstrate that, with our
simple convolutional neural network architecture strengthened by our proposed
training algorithm, our model is able to outperform or be comparable with the
state-of-the-art methods. Furthermore, we also evaluate our density map
generation approach and distillation algorithm in ablation studies.
- Abstract(参考訳): 近年,深層学習技術の進歩に伴い,群集数化が急速に進んでいる。
本研究では,様々な混み合った場面で最先端のパフォーマンスを達成できる,シンプルで効果的な群集カウントフレームワークを提案する。
特に,まず,点アノテーションから地平線密度マップを作成できる視点対応密度マップ生成手法を導入し,事前密度マップ生成手法よりも優れた性能を実現するために,群集カウントモデルを訓練する。
さらに, 密度マップ生成法を応用し, 出力密度マップの次元を著しく犠牲にすることなく, 同一のネットワーク構造で漸進的にモデルを強化する反復蒸留アルゴリズムを提案する。
実験では,提案する学習アルゴリズムによって強化された単純な畳み込みニューラルネットワークアーキテクチャを用いて,最先端の手法に匹敵する性能を持つことを示す。
さらに, アブレーション研究における密度マップ生成手法と蒸留アルゴリズムについても検討した。
関連論文リスト
- A Paradigm Shift in Mouza Map Vectorization: A Human-Machine Collaboration Approach [2.315458677488431]
現在の手動のデジタル化手法は時間と労力がかかる。
本研究では,デジタル化プロセスの効率化と,時間と人的資源の節約を目的とした半自動化手法を提案する。
論文 参考訳(メタデータ) (2024-10-21T12:47:36Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Hi-Map: Hierarchical Factorized Radiance Field for High-Fidelity
Monocular Dense Mapping [51.739466714312805]
ニューラルラジアンス場(NeRF)に基づく新しいモノクリン高密度マッピング手法であるHi-Mapを導入する。
ハイマップは、RGB入力のみを用いた効率的かつ高忠実なマッピングを実現する能力において例外的である。
論文 参考訳(メタデータ) (2024-01-06T12:32:25Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Redesigning Multi-Scale Neural Network for Crowd Counting [68.674652984003]
本稿では, 集団カウントのための多スケール密度マップを階層的にマージする, 密度専門家の階層的混合を導入する。
階層構造の中では、すべてのスケールからの貢献を促進するために、専門家の競争とコラボレーションのスキームが提示されます。
実験の結果,提案手法は5つの公開データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-08-04T21:49:29Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Enhancing Deep Neural Network Saliency Visualizations with Gradual
Extrapolation [0.0]
Grad-CAMやExcit Backpropagationのようなクラスアクティベーションマッピング手法の拡張手法を提案する。
我々のアイデアはGradual Extrapolationと呼ばれ、出力をシャープすることでヒートマップ画像を生成するメソッドを補うことができる。
論文 参考訳(メタデータ) (2021-04-11T07:39:35Z) - A Strong Baseline for Crowd Counting and Unsupervised People
Localization [2.690502103971799]
本研究では,クラウドカウントのための強力なベースラインと,推定密度マップに基づく非教師なしの人物ローカライゼーションアルゴリズムについて検討する。
さまざまなバックボーンを収集して,その変更の影響を評価します。
そこで本研究では,KMeansと命名されたクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-07T08:29:03Z) - Coarse- and Fine-grained Attention Network with Background-aware Loss
for Crowd Density Map Estimation [2.690502103971799]
CFANetは、高品質な群衆密度マップを生成する新しい方法であり、人を数える。
集合領域認識器 (CRR) と密度レベル推定器 (DLE) を結合して, 粗大から細大に進行する注意機構を考案する。
提案手法は,従来の最先端手法をカウント精度で上回るだけでなく,密度マップの画質の向上や,誤認識率の低減にも寄与する。
論文 参考訳(メタデータ) (2020-11-07T08:05:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。