論文の概要: An Improved Dilated Convolutional Network for Herd Counting in Crowded
Scenes
- arxiv url: http://arxiv.org/abs/2008.07254v1
- Date: Mon, 17 Aug 2020 12:31:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 04:00:13.775829
- Title: An Improved Dilated Convolutional Network for Herd Counting in Crowded
Scenes
- Title(参考訳): 群集シーンにおける群集カウントのための拡張畳み込みネットワークの改良
- Authors: Soufien Hamrouni, Hakim Ghazzai, Hamid Menouar and Yahya Massoud
- Abstract要約: 本稿では,2つの双方向畳み込み型ディープラーニングアーキテクチャからなる正確なモニタリングシステムを提案する。
提案モデルでは,最先端手法よりも30%高速に収束することが示されている。
上海データセットに適用すると、平均絶対誤差(MAE)が20%低い。
- 参考スコア(独自算出の注目度): 1.7358040670413502
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Crowd management technologies that leverage computer vision are widespread in
contemporary times. There exists many security-related applications of these
methods, including, but not limited to: following the flow of an array of
people and monitoring large gatherings. In this paper, we propose an accurate
monitoring system composed of two concatenated convolutional deep learning
architectures. The first part called Front-end, is responsible for converting
bi-dimensional signals and delivering high-level features. The second part,
called the Back-end, is a dilated Convolutional Neural Network (CNN) used to
replace pooling layers. It is responsible for enlarging the receptive field of
the whole network and converting the descriptors provided by the first network
to a saliency map that will be utilized to estimate the number of people in
highly congested images. We also propose to utilize a genetic algorithm in
order to find an optimized dilation rate configuration in the back-end. The
proposed model is shown to converge 30\% faster than state-of-the-art
approaches. It is also shown that it achieves 20\% lower Mean Absolute Error
(MAE) when applied to the Shanghai data~set.
- Abstract(参考訳): コンピュータビジョンを利用する群衆管理技術は現代に広く普及している。
これらの手法にはセキュリティ関連の応用が多数存在するが、これは制限されない: 人々の流れを辿り、大規模な集まりを監視する。
本稿では,2つの畳み込み畳み込み深層学習アーキテクチャからなる正確なモニタリングシステムを提案する。
最初のパートであるFront-endは、二次元信号の変換と高レベルの機能の提供を担当している。
第2部はバックエンドと呼ばれ、プール層を置き換えるために使用される拡張畳み込みニューラルネットワーク(CNN)である。
ネットワーク全体の受容領域を拡大し、第1のネットワークによって提供される記述子を、高度に混雑した画像の人数を推定するために利用するサリエンシマップに変換する責任を負う。
また,バックエンドに最適化された拡張率構成を求めるために遺伝的アルゴリズムを提案する。
提案モデルでは,最先端手法よりも30倍早く収束することが示されている。
また,上海データ~セットに適用すると,20%下方平均絶対誤差(mae)が達成できることを示した。
関連論文リスト
- TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Improved Convergence Guarantees for Shallow Neural Networks [91.3755431537592]
勾配降下法により訓練された深度2ニューラルネットの収束度を世界最小とする。
我々のモデルには、二次損失関数による回帰、完全連結フィードフォワードアーキテクチャ、RelUアクティベーション、ガウスデータインスタンス、逆ラベルといった特徴がある。
彼らは、少なくとも我々のモデルでは、収束現象がNTK体制をはるかに超越していることを強く示唆している」。
論文 参考訳(メタデータ) (2022-12-05T14:47:52Z) - PDFNet: Pointwise Dense Flow Network for Urban-Scene Segmentation [0.0]
我々はポイントワイド高密度フローネットワーク(PDFNet)という新しい軽量アーキテクチャを提案する。
PDFNetでは、ネットワークのすべての部分へのスムーズな勾配流を可能にするために、密集、残留、複数ショートカット接続を使用します。
提案手法は,小規模なクラスや少数のデータレギュレーションにおいて,ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2021-09-21T10:39:46Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Dynamic Graph: Learning Instance-aware Connectivity for Neural Networks [78.65792427542672]
動的グラフネットワーク(DG-Net)は完全な有向非巡回グラフであり、ノードは畳み込みブロックを表し、エッジは接続経路を表す。
ネットワークの同じパスを使用する代わりに、DG-Netは各ノードの機能を動的に集約する。
論文 参考訳(メタデータ) (2020-10-02T16:50:26Z) - Monocular Depth Estimation Using Multi Scale Neural Network And Feature
Fusion [0.0]
ネットワークは2つの異なるブロックを使用し、まず、各特徴マップの畳み込みとマージに異なるフィルタサイズを使用する。
第2ブロックは、完全に連結された層の代わりに拡張畳み込みを使用し、計算を減らし、受容場を増大させる。
我々は、RMSE損失とSILog損失からなる深さ推定のための標準評価指標を用いて、Make 3Dデータセット、NYU Depth V2データセット、Kittiデータセットでネットワークをトレーニングし、テストする。
論文 参考訳(メタデータ) (2020-09-11T18:08:52Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。