論文の概要: Rethinking Spatial Invariance of Convolutional Networks for Object
Counting
- arxiv url: http://arxiv.org/abs/2206.05253v1
- Date: Fri, 10 Jun 2022 17:51:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 15:38:52.720711
- Title: Rethinking Spatial Invariance of Convolutional Networks for Object
Counting
- Title(参考訳): 対数計数のための畳み込みネットワークの空間不変性再考
- Authors: Zhi-Qi Cheng, Qi Dai, Hong Li, JingKuan Song, Xiao Wu, Alexander G.
Hauptmann
- Abstract要約: 局所連結ガウス核を用いて元の畳み込みフィルタを置き換え、密度写像の空間位置を推定する。
従来の研究から着想を得て,大規模なガウス畳み込みの近似を好意的に実装するために,翻訳不変性を伴う低ランク近似を提案する。
提案手法は,他の最先端手法を著しく上回り,物体の空間的位置の有望な学習を実現する。
- 参考スコア(独自算出の注目度): 119.83017534355842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous work generally believes that improving the spatial invariance of
convolutional networks is the key to object counting. However, after verifying
several mainstream counting networks, we surprisingly found too strict
pixel-level spatial invariance would cause overfit noise in the density map
generation. In this paper, we try to use locally connected Gaussian kernels to
replace the original convolution filter to estimate the spatial position in the
density map. The purpose of this is to allow the feature extraction process to
potentially stimulate the density map generation process to overcome the
annotation noise. Inspired by previous work, we propose a low-rank
approximation accompanied with translation invariance to favorably implement
the approximation of massive Gaussian convolution. Our work points a new
direction for follow-up research, which should investigate how to properly
relax the overly strict pixel-level spatial invariance for object counting. We
evaluate our methods on 4 mainstream object counting networks (i.e., MCNN,
CSRNet, SANet, and ResNet-50). Extensive experiments were conducted on 7
popular benchmarks for 3 applications (i.e., crowd, vehicle, and plant
counting). Experimental results show that our methods significantly outperform
other state-of-the-art methods and achieve promising learning of the spatial
position of objects.
- Abstract(参考訳): 従来の研究は一般に、畳み込みネットワークの空間的不変性を改善することが、オブジェクトカウントの鍵であると考えている。
しかし,いくつかの主流ネットワークを検証した結果,厳密な画素レベルの空間不分散が密度マップ生成に過剰なノイズをもたらすことがわかった。
本稿では,局所連結型ガウス核を用いて元の畳み込みフィルタを置き換え,密度マップ内の空間的位置を推定する。
この目的は、特徴抽出プロセスが、アノテーションノイズを克服するために密度マップ生成プロセスを潜在的に刺激することである。
先行研究に触発されて, 大規模ガウス畳み込みの近似を好適に実装するために, 変換不変性を伴う低ランク近似を提案する。
本研究はフォローアップ研究の新たな方向性を指摘し,オブジェクトカウントのための過度に厳密なピクセルレベルの空間不変性を適切に緩和する方法を検討する。
本手法は,4つの主流オブジェクトカウントネットワーク(MCNN,CSRNet,SANet,ResNet-50)上で評価する。
3つのアプリケーション(群衆、車両、植物計数など)のための7つの人気のあるベンチマークで広範な実験が行われた。
実験の結果,本手法は他の最先端手法を著しく上回っており,対象物の空間的位置を有望に学習できることがわかった。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Hyperspectral Target Detection Based on Low-Rank Background Subspace
Learning and Graph Laplacian Regularization [2.9626402880497267]
ハイパースペクトル目標検出は、スペクトル特性に基づく薄暗い物体や小さな物体の発見に有効である。
既存の表現に基づく手法は、未知の背景辞書の問題によって妨げられる。
本稿では低ランク表現(LRR)とグラフラプラシア正規化(GLR)に基づく効率的な最適化手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T13:51:08Z) - Binarizing Sparse Convolutional Networks for Efficient Point Cloud
Analysis [93.55896765176414]
我々は,効率的な点群解析のためのBSC-Netと呼ばれるバイナリスパース畳み込みネットワークを提案する。
我々は,移動したスパース畳み込みにおけるサイトマッチングに最適なオプションを見つけるために,異なる検索戦略を採用している。
我々のBSC-Netは、我々の厳格なベースラインを大幅に改善し、最先端のネットワーク双対化手法より優れています。
論文 参考訳(メタデータ) (2023-03-27T13:47:06Z) - Improved Counting and Localization from Density Maps for Object
Detection in 2D and 3D Microscopy Imaging [4.746727774540763]
密度マップから対象をカウント・ローカライズする別の方法を提案する。
その結果,2次元および3次元顕微鏡データにおけるオブジェクトのカウントとローカライゼーションの性能が向上した。
論文 参考訳(メタデータ) (2022-03-29T15:54:19Z) - Object-aware Monocular Depth Prediction with Instance Convolutions [72.98771405534937]
本稿では,特徴集合を避けるために明示的に調整された新しい畳み込み演算子を提案する。
提案手法は,部分ごとの深度をスーパーピクセルで推定する。
NYUv2とiBimsデータセットに対する我々の評価は、インスタンスの畳み込みの優位性を明確に示している。
論文 参考訳(メタデータ) (2021-12-02T18:59:48Z) - Point Cloud Upsampling via Disentangled Refinement [86.3641957163818]
3Dスキャンによって生成された点雲は、しばしばスパース、非均一、ノイズである。
近年のアップサンプリング手法は, 分布均一性と近接場を両立させながら, 密度の高い点集合を生成することを目的としている。
2つのカスケードサブネットワーク、高密度ジェネレータ、空間精錬器を定式化する。
論文 参考訳(メタデータ) (2021-06-09T02:58:42Z) - FFD: Fast Feature Detector [22.51804239092462]
特定のスケール空間領域にロバストで正確なキーポイントが存在することを示す。
スケールスペースピラミッドの滑らか度比とぼかしをそれぞれ2と0.627に設定することで、信頼性の高いキーポイントの検出が容易であることが証明された。
論文 参考訳(メタデータ) (2020-12-01T21:56:35Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Learning Gaussian Maps for Dense Object Detection [1.8275108630751844]
類似したオブジェクトが互いに近接して配置されるシーンにおいて,共通かつ高精度なオブジェクト検出手法を概説する。
ガウス写像のマルチタスク学習と分類と境界ボックス回帰がベースラインの精度を大幅に向上させることを示す。
提案手法は,SKU110K citesku110kデータセットの精度も向上する。
論文 参考訳(メタデータ) (2020-04-24T17:01:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。