論文の概要: Scale-Aware Crowd Count Network with Annotation Error Correction
- arxiv url: http://arxiv.org/abs/2312.16771v1
- Date: Thu, 28 Dec 2023 01:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 18:04:12.579131
- Title: Scale-Aware Crowd Count Network with Annotation Error Correction
- Title(参考訳): アノテーション誤り訂正を伴うスケールアウェア群数ネットワーク
- Authors: Yi-Kuan Hsieh, Jun-Wei Hsieh, Yu-Chee Tseng, Ming-Ching Chang, Li Xin
- Abstract要約: 従来のクラウドカウントネットワークは、プール層を通じてフィーチャーマップがダウンサイズされると、情報損失に悩まされる。
本稿では,ノイズの多いアノテーションの誤り訂正機能を備えたスケール・アウェア・アーキテクチャを導入するスケール・アウェア・クラウドカウンティング・ネットワーク(SACC-Net)を提案する。
- 参考スコア(独自算出の注目度): 19.036693336902662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional crowd counting networks suffer from information loss when feature
maps are downsized through pooling layers, leading to inaccuracies in counting
crowds at a distance. Existing methods often assume correct annotations during
training, disregarding the impact of noisy annotations, especially in crowded
scenes. Furthermore, the use of a fixed Gaussian kernel fails to account for
the varying pixel distribution with respect to the camera distance. To overcome
these challenges, we propose a Scale-Aware Crowd Counting Network (SACC-Net)
that introduces a ``scale-aware'' architecture with error-correcting
capabilities of noisy annotations. For the first time, we {\bf simultaneously}
model labeling errors (mean) and scale variations (variance) by
spatially-varying Gaussian distributions to produce fine-grained heat maps for
crowd counting. Furthermore, the proposed adaptive Gaussian kernel variance
enables the model to learn dynamically with a low-rank approximation, leading
to improved convergence efficiency with comparable accuracy. The performance of
SACC-Net is extensively evaluated on four public datasets: UCF-QNRF, UCF CC 50,
NWPU, and ShanghaiTech A-B. Experimental results demonstrate that SACC-Net
outperforms all state-of-the-art methods, validating its effectiveness in
achieving superior crowd counting accuracy.
- Abstract(参考訳): 従来の群衆カウントネットワークは、プール層を通じてフィーチャーマップが縮小されると情報損失を被り、遠くにいる群衆をカウントするのに不正確になる。
既存の手法では、特に混み合った場面では、ノイズの多いアノテーションの影響を無視して、トレーニング中に正しいアノテーションを仮定することが多い。
さらに、固定されたガウスカーネルの使用は、カメラ距離に関して異なる画素分布を考慮できない。
これらの課題を克服するために、ノイズの多いアノテーションのエラー訂正機能を備えた‘スケール・アウェア’アーキテクチャを導入したスケール・アウェア・クラウドカウントネットワーク(SACC-Net)を提案する。
空間的に変動するガウス分布を用いたモデルラベリング誤差 (mean) とスケール変動 (distribution) のモデルラベリング誤差 (mean) を初めて観測し, 群数計数のための細粒度熱マップを作成した。
さらに,提案する適応ガウス核分散により,低ランク近似による動的学習が可能となり,同等精度で収束効率が向上した。
SACC-Netの性能は、UCF-QNRF、UCF CC 50、NWPU、ShanghaiTech A-Bの4つの公開データセットで広く評価されている。
実験結果から,SACC-Netはすべての最先端手法より優れており,群衆カウント精度が向上することを示す。
関連論文リスト
- Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Over-the-Air Federated Learning and Optimization [52.5188988624998]
エッジ・ザ・エア計算(AirComp)によるフェデレーション学習(FL)に焦点を当てる。
本稿では,AirComp ベースの FedAvg (AirFedAvg) アルゴリズムの凸および非凸条件下での収束について述べる。
エッジデバイス(モデル、勾配、モデル差など)で送信できるローカルアップデートの種類によって、AirFedAvgで送信するとアグリゲーションエラーが発生する可能性がある。
さらに、より実用的な信号処理方式を検討し、通信効率を改善し、これらの信号処理方式によって引き起こされるモデル集約誤差の異なる形式に収束解析を拡張する。
論文 参考訳(メタデータ) (2023-10-16T05:49:28Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - Direct Measure Matching for Crowd Counting [59.66286603624411]
そこで本研究では,予測密度マップを散乱点付基底真理に直接回帰する測度に基づく新しい計数手法を提案する。
本稿では, シンクホーンの測位損失を計測するために設計した, 半平衡型のシンクホーン発散を導出する。
論文 参考訳(メタデータ) (2021-07-04T06:37:33Z) - Wireless Federated Learning with Limited Communication and Differential
Privacy [21.328507360172203]
本稿では,空力計算(AirComp)に基づくフェデレーション学習(FL)モデルにおいて,リモートユーザにおけるローカルデータセットの効率的な通信と差分プライバシー(DP)における次元性低減の役割について検討する。
論文 参考訳(メタデータ) (2021-06-01T15:23:12Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。