論文の概要: Multi-channel Deep Supervision for Crowd Counting
- arxiv url: http://arxiv.org/abs/2103.09553v1
- Date: Wed, 17 Mar 2021 10:33:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 12:58:22.917983
- Title: Multi-channel Deep Supervision for Crowd Counting
- Title(参考訳): クラウドカウントのためのマルチチャネル深層監視
- Authors: Bo Wei, Mulin Chen, Qi Wang, Xuelong Li
- Abstract要約: MDS(Multi- Channel Deep Supervision)と呼ばれる新しい監視フレームワークを提案する。
MDSは、密度マップの生成を支援するために、推定モデルのデコーダをチャネルワイズで監視する。
異なるチャネルの正確な監視情報を得るために、MDSNetはSupervisionNet(SN)と呼ばれる補助ネットワークを使用している。
- 参考スコア(独自算出の注目度): 92.39562949707815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd counting is a task worth exploring in modern society because of its
wide applications such as public safety and video monitoring. Many CNN-based
approaches have been proposed to improve the accuracy of estimation, but there
are some inherent issues affect the performance, such as overfitting and
details lost caused by pooling layers. To tackle these problems, in this paper,
we propose an effective network called MDSNet, which introduces a novel
supervision framework called Multi-channel Deep Supervision (MDS). The MDS
conducts channel-wise supervision on the decoder of the estimation model to
help generate the density maps. To obtain the accurate supervision information
of different channels, the MDSNet employs an auxiliary network called
SupervisionNet (SN) to generate abundant supervision maps based on existing
groundtruth. Besides the traditional density map supervision, we also use the
SN to convert the dot annotations into continuous supervision information and
conduct dot supervision in the MDSNet. Extensive experiments on several
mainstream benchmarks show that the proposed MDSNet achieves competitive
results and the MDS significantly improves the performance without changing the
network structure.
- Abstract(参考訳): 群衆カウントは、公共の安全やビデオ監視といった幅広い用途のために、現代社会で探索する価値のあるタスクである。
多くのCNNベースのアプローチが見積もりの精度を改善するために提案されているが、プール層によるオーバーフィットや詳細の喪失など、パフォーマンスに固有の問題がいくつかある。
本稿では,MDS(Multi-channel Deep Supervision)と呼ばれる新しい監視フレームワークを導入するMDSNetというネットワークを提案する。
MDSは、密度マップの生成を支援するために、推定モデルのデコーダをチャネル的に監視する。
異なるチャネルの正確な監視情報を得るために、MDSNetはSupervisionNet(SN)と呼ばれる補助ネットワークを使用して、既存の基盤に基づいて豊富な監視マップを生成する。
従来の密度マップの監視に加えて、SNを使用してドットアノテーションを連続的な監視情報に変換し、MDSNetでドット監視を行う。
いくつかの主要なベンチマークにおいて、提案したMDSNetは競合する結果となり、MDSNetはネットワーク構造を変えることなく性能を著しく向上することを示した。
関連論文リスト
- TBSN: Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師型イメージデノベーション(SSID)において一般的なネットワークアーキテクチャである。
本稿では, ブラインドスポット要求を満たす変圧器演算子の解析と再設計により, 変圧器ベースブラインドスポットネットワーク(TBSN)を提案する。
空間的自己注意のために、注意行列に精巧なマスクを適用して受容場を制限し、拡張された畳み込みを模倣する。
チャネル自己アテンションについては,マルチスケールアーキテクチャの深層部において,チャネル数が空間的サイズよりも大きい場合,盲点情報を漏洩する可能性がある。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Parallel Multi-Scale Networks with Deep Supervision for Hand Keypoint
Detection [3.1781111932870716]
マルチスケールディープスーパービジョンネットワーク(P-MSDSNet)という新しいCNNモデルを提案する。
P-MSDSNetは、層から層への適応的な特徴伝達のための注意マップを作成するために、深い監督の下で異なるスケールで特徴マップを学習する。
P-MSDSNetは,パラメータの少ないベンチマークデータセットにおいて,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-12-19T22:38:16Z) - Semi-supervised Network Embedding with Differentiable Deep Quantisation [81.49184987430333]
我々はネットワーク埋め込みのための微分可能な量子化法であるd-SNEQを開発した。
d-SNEQは、学習された量子化符号にリッチな高次情報を与えるためにランク損失を組み込む。
トレーニング済みの埋め込みのサイズを大幅に圧縮できるため、ストレージのフットプリントが減少し、検索速度が向上する。
論文 参考訳(メタデータ) (2021-08-20T11:53:05Z) - MSDPN: Monocular Depth Prediction with Partial Laser Observation using
Multi-stage Neural Networks [1.1602089225841632]
深層学習に基づくマルチステージネットワークアーキテクチャであるMulti-Stage Depth Prediction Network (MSDPN)を提案する。
MSDPNは2次元LiDARと単眼カメラを用いて深度マップを予測する。
実験により,本ネットワークは最先端手法に対して有望な性能を示す。
論文 参考訳(メタデータ) (2020-08-04T08:27:40Z) - M^3VSNet: Unsupervised Multi-metric Multi-view Stereo Network [13.447649324253572]
本稿では,M3VSNet という無監督マルチメトリックMVSネットワークを提案する。
点雲再構成の堅牢性と完全性を改善するために,画素ワイドと特徴ワイドのロス関数を組み合わせた多値損失関数を提案する。
実験の結果,M3VSNetは最先端の教師なし手法を確立し,従来の教師なしMVSNetと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2020-04-30T09:26:51Z) - M^3VSNet: Unsupervised Multi-metric Multi-view Stereo Network [13.447649324253572]
本稿では,M3VSNet という無監督マルチメトリックMVSネットワークを提案する。
点雲再構成の堅牢性と完全性を改善するために,画素ワイドと特徴ワイドのロス関数を組み合わせた多値損失関数を提案する。
実験の結果,M3VSNetは最先端の教師なし手法を確立し,従来の教師なしMVSNetと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2020-04-21T02:45:25Z) - Decentralized Learning for Channel Allocation in IoT Networks over
Unlicensed Bandwidth as a Contextual Multi-player Multi-armed Bandit Game [134.88020946767404]
本稿では,プライマリセルネットワークにライセンスされたスペクトルに基づいて,アドホックなモノのインターネットネットワークにおける分散チャネル割り当て問題について検討する。
本研究では,この問題をコンテキスト型マルチプレイヤー・マルチアームバンディットゲームにマッピングし,試行錯誤による純粋に分散化された3段階ポリシー学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-30T10:05:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。