論文の概要: Enhancing and Dissecting Crowd Counting By Synthetic Data
- arxiv url: http://arxiv.org/abs/2201.08992v1
- Date: Sat, 22 Jan 2022 08:16:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 09:43:49.602345
- Title: Enhancing and Dissecting Crowd Counting By Synthetic Data
- Title(参考訳): 合成データによる群衆数の増加と分別
- Authors: Yi Hou, Chengyang Li, Yuheng Lu, Liping Zhu, Yuan Li, Huizhu Jia,
Xiaodong Xie
- Abstract要約: 本研究では,大規模かつ正確なラベル付け,パラメータ化実現,忠実度を有するクラウドカウントデータセット CrowdX を提案する。
このデータセットをデータエンハンスメントとして使用することにより,提案した合理化および効率的なベンチマークネットワークESA-Netの性能を8.4%向上させることができることを示す。
- 参考スコア(独自算出の注目度): 19.158764950403885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this article, we propose a simulated crowd counting dataset CrowdX, which
has a large scale, accurate labeling, parameterized realization, and high
fidelity. The experimental results of using this dataset as data enhancement
show that the performance of the proposed streamlined and efficient benchmark
network ESA-Net can be improved by 8.4\%. The other two classic heterogeneous
architectures MCNN and CSRNet pre-trained on CrowdX also show significant
performance improvements. Considering many influencing factors determine
performance, such as background, camera angle, human density, and resolution.
Although these factors are important, there is still a lack of research on how
they affect crowd counting. Thanks to the CrowdX dataset with rich annotation
information, we conduct a large number of data-driven comparative experiments
to analyze these factors. Our research provides a reference for a deeper
understanding of the crowd counting problem and puts forward some useful
suggestions in the actual deployment of the algorithm.
- Abstract(参考訳): 本稿では,大規模かつ高精度なラベリング,パラメータ化実現,高忠実度を有する群集計数データセット crowdx を提案する。
このデータセットをデータエンハンスメントとして使用する実験結果から,提案手法を合理化し,効率的なベンチマークネットワークであるesa-netの性能を8.4\%向上できることがわかった。
他の2つの古典的ヘテロジニアスアーキテクチャ MCNN と CSRNet が CrowdX で事前訓練された。
多くの影響要因を考慮して、背景、カメラアングル、人間密度、解像度などの性能を決定する。
これらの要因は重要であるが、群衆数にどのように影響するかに関する研究が不足している。
リッチなアノテーション情報を持つcrowdxデータセットのおかげで,これらの要因を分析するために,データ駆動比較実験を多数実施する。
本研究は,群集計数問題のより深い理解のためのリファレンスを提供し,アルゴリズムの実際の展開において有用な提案を提示する。
関連論文リスト
- Comparing Importance Sampling Based Methods for Mitigating the Effect of
Class Imbalance [0.0]
我々は,損失再加重,アンダーサンプリング,オーバーサンプリングという,重要なサンプリングから導かれる3つのテクニックを比較した。
アンダーサンプリングにおける損失の重み付けは、アンダー表現されたクラスの性能に悪影響を及ぼすことがわかった。
我々の発見は、プラネタリーデータセットに何らかの冗長性が存在することも示唆している。
論文 参考訳(メタデータ) (2024-02-28T22:52:27Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Replication: Contrastive Learning and Data Augmentation in Traffic
Classification Using a Flowpic Input Representation [47.95762911696397]
同じデータセット上で[16]を再現し、3つの追加の公開データセット上で最も健全なアスペクト(データ拡張の重要性)を複製します。
元の結果のほとんどを確認できたが、元のデータセットにデータシフトがあったため、調査されたシナリオの20%の精度低下が判明した。
論文 参考訳(メタデータ) (2023-09-18T12:55:09Z) - TrueDeep: A systematic approach of crack detection with less data [0.0]
ドメイン知識をディープラーニングアーキテクチャと組み合わせることで、少ないデータで同様のパフォーマンスを実現することができることを示す。
我々のアルゴリズムは、全データの23%で開発され、テストデータ上でも同様の性能を持ち、複数の盲点データセット上では大幅に性能が向上した。
論文 参考訳(メタデータ) (2023-05-30T14:51:58Z) - Improving Classifier Training Efficiency for Automatic Cyberbullying
Detection with Feature Density [58.64907136562178]
言語支援の異なる特徴前処理手法を用いて特徴密度(FD)の有効性を検討した。
データセットの複雑さを推定することで、必要な実験の数を削減できると仮定する。
データセットの言語的複雑さの違いにより、言語的に支援された単語前処理の有効性を議論することが可能になる。
論文 参考訳(メタデータ) (2021-11-02T15:48:28Z) - MogFace: Rethinking Scale Augmentation on the Face Detector [17.570686622370403]
本研究では,画像の前景情報と後景情報とスケール情報を含む先行ソリューションの違いについて検討する。
本稿では,これらの2つの情報を効率的に同時に同化できるSSE戦略を提案する。
本手法は,すべての顔検出ベンチマークにおける最先端検出性能を実現する。
論文 参考訳(メタデータ) (2021-03-20T09:17:04Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。