論文の概要: An Improved Normed-Deformable Convolution for Crowd Counting
- arxiv url: http://arxiv.org/abs/2206.08084v1
- Date: Thu, 16 Jun 2022 10:56:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-18 04:08:58.290674
- Title: An Improved Normed-Deformable Convolution for Crowd Counting
- Title(参考訳): 群衆カウントにおける正規変形型畳み込み法の改良
- Authors: Xin Zhong, Zhaoyi Yan, Jing Qin, Wangmeng Zuo and Weigang Lu
- Abstract要約: 頭の中のCNN機能のスケール適応機能を活用するために、変形可能な畳み込みを提案する。
本論文では,改良されたノーマッド・デフォルマブル・コンボリューション(textiti.e.NDConv)を提案する。
本手法は,上海技術A,上海技術B,UCF_QNRF,UCF_CC_50データセットの最先端手法より優れている。
- 参考スコア(独自算出の注目度): 70.02434289611566
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, crowd counting has become an important issue in computer
vision. In most methods, the density maps are generated by convolving with a
Gaussian kernel from the ground-truth dot maps which are marked around the
center of human heads. Due to the fixed geometric structures in CNNs and
indistinct head-scale information, the head features are obtained incompletely.
Deformable convolution is proposed to exploit the scale-adaptive capabilities
for CNN features in the heads. By learning the coordinate offsets of the
sampling points, it is tractable to improve the ability to adjust the receptive
field. However, the heads are not uniformly covered by the sampling points in
the deformable convolution, resulting in loss of head information. To handle
the non-uniformed sampling, an improved Normed-Deformable Convolution
(\textit{i.e.,}NDConv) implemented by Normed-Deformable loss
(\textit{i.e.,}NDloss) is proposed in this paper. The offsets of the sampling
points which are constrained by NDloss tend to be more even. Then, the features
in the heads are obtained more completely, leading to better performance.
Especially, the proposed NDConv is a light-weight module which shares similar
computation burden with Deformable Convolution. In the extensive experiments,
our method outperforms state-of-the-art methods on ShanghaiTech A, ShanghaiTech
B, UCF\_QNRF, and UCF\_CC\_50 dataset, achieving 61.4, 7.8, 91.2, and 167.2
MAE, respectively. The code is available at
https://github.com/bingshuangzhuzi/NDConv
- Abstract(参考訳): 近年,コンピュータビジョンにおいて,群集カウントが重要な問題となっている。
ほとんどの方法では、密度マップは、人間の頭の中心にマークされた接地トラスドットマップからガウス核と結合して生成される。
cnnの固定幾何構造と不明瞭な頭部スケール情報により、頭部特徴が不完全に得られる。
頭の中のCNN機能のスケール適応機能を活用するために、変形可能な畳み込みを提案する。
サンプリング点の座標オフセットを学習することにより、受容場を調整する能力を向上させることができる。
しかし、ヘッドは変形可能な畳み込みにおいてサンプリングポイントによって均一に覆われず、ヘッド情報が失われる。
非一様サンプリングを扱うために,Normed-Deformable loss(\textit{i.e.,}NDConv)を改良したNormed-Deformable Convolution(\textit{i.e.,}NDloss)を提案する。
NDloss によって制約されるサンプリングポイントのオフセットは、さらに高くなる傾向にある。
その後、頭部の特徴がより完全に得られ、パフォーマンスが向上する。
特に提案したNDConvは、Deformable Convolutionと同じような計算負荷を共有する軽量モジュールである。
広汎な実験では,上海技術A,上海技術B,UCF\_QNRF,UCF\_CC\_50データセットにおいて,それぞれ61.4,7.8,91.2,167.2 MAEを達成し,最先端の手法よりも優れていた。
コードはhttps://github.com/bingshuangzhuzi/ndconvで入手できる。
関連論文リスト
- Scalable Graph Compressed Convolutions [68.85227170390864]
ユークリッド畳み込みのための入力グラフのキャリブレーションに置換を適用する微分可能手法を提案する。
グラフキャリブレーションに基づいて,階層型グラフ表現学習のための圧縮畳み込みネットワーク(CoCN)を提案する。
論文 参考訳(メタデータ) (2024-07-26T03:14:13Z) - LDConv: Linear deformable convolution for improving convolutional neural networks [18.814748446649627]
Linear Deformable Convolution (LDConv) は、ネットワーク性能を改善するために畳み込み操作を置き換えることができる、プラグアンドプレイの畳み込み操作である。
LDConvは、標準畳み込みと変形可能なConvのパラメータ数の成長傾向を線形成長に補正する。
論文 参考訳(メタデータ) (2023-11-20T07:54:54Z) - Revisiting Deformable Convolution for Depth Completion [40.45231083385708]
深度完備化は、スパース深度マップから高品質の高密度深度マップを作成することを目的としている。
従来の作業では、通常、RGBイメージをガイダンスとして使用し、推定された粗い深度マップを洗練するための反復的な空間伝播を導入している。
変形可能なカーネルの畳み込みを単一パスリファインメントモジュールとして活用する,効率的なアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-03T17:59:06Z) - Adaptive Self-supervision Algorithms for Physics-informed Neural
Networks [59.822151945132525]
物理情報ニューラルネットワーク(PINN)は、損失関数のソフト制約として問題領域からの物理的知識を取り入れている。
これらのモデルの訓練性に及ぼす座標点の位置の影響について検討した。
モデルがより高い誤りを犯している領域に対して、より多くのコロケーションポイントを段階的に割り当てる適応的コロケーション方式を提案する。
論文 参考訳(メタデータ) (2022-07-08T18:17:06Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - Dilated convolution with learnable spacings [6.6389732792316005]
CNNは視覚変換器と競合するために受容野(RF)を必要とする。
RFは、畳み込みカーネルのサイズを増やすことで簡単に拡大できる。
トレーニング可能なパラメータの数は、2Dの場合、カーネルのサイズと4倍にスケールするが、急速に禁止される。
本稿では,パラメータ数を増大させることなくRFサイズを増大させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-07T14:54:24Z) - Adaptive Graph Convolution for Point Cloud Analysis [25.175406613705274]
本稿では,動的に学習した特徴に応じて適応的なカーネルを生成する適応グラフ畳み込み(Adaptive Graph Convolution, AdaptConv)を提案する。
提案手法は,いくつかのベンチマークデータセットにおいて,最先端のクラウド分類とセグメンテーションアプローチより優れている。
論文 参考訳(メタデータ) (2021-08-18T08:38:52Z) - Content-Aware Convolutional Neural Networks [98.97634685964819]
畳み込みニューラルネットワーク(CNN)は、畳み込み層の強力な特徴学習能力によって大きな成功を収めている。
本研究では,スムーズなウィンドウを自動的に検出し,元の大規模カーネルを置き換えるために1x1畳み込みカーネルを適用するContent-aware Convolution (CAC)を提案する。
論文 参考訳(メタデータ) (2021-06-30T03:54:35Z) - Decoupled Dynamic Filter Networks [85.38058820176047]
これらの欠点を同時に解決できるDDF(Decoupled Dynamic Filter)を提案します。
最近の注目の高まりに触発されて、DDFは深度ワイドなダイナミックフィルタを空間的およびチャネル的ダイナミックフィルタに分離する。
分類ネットワークにおける標準畳み込みをDFFに置き換える際の性能向上を観察する。
論文 参考訳(メタデータ) (2021-04-29T04:55:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。