論文の概要: Boosting Detection in Crowd Analysis via Underutilized Output Features
- arxiv url: http://arxiv.org/abs/2308.16187v1
- Date: Wed, 30 Aug 2023 17:59:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-31 12:34:36.694362
- Title: Boosting Detection in Crowd Analysis via Underutilized Output Features
- Title(参考訳): 未利用出力特徴を用いた群集分析におけるブースティング検出
- Authors: Shaokai Wu, Fengyu Yang
- Abstract要約: 群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集
これらの手法の可能性は、しばしば無視される群集分析に重要な情報を提供するため、過小評価されていると我々は主張する。
既存の検出モデルと容易に統合可能なプラグイン・アンド・プレイモジュールであるCrowd Hatを提案する。
- 参考スコア(独自算出の注目度): 8.319283909091595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detection-based methods have been viewed unfavorably in crowd analysis due to
their poor performance in dense crowds. However, we argue that the potential of
these methods has been underestimated, as they offer crucial information for
crowd analysis that is often ignored. Specifically, the area size and
confidence score of output proposals and bounding boxes provide insight into
the scale and density of the crowd. To leverage these underutilized features,
we propose Crowd Hat, a plug-and-play module that can be easily integrated with
existing detection models. This module uses a mixed 2D-1D compression technique
to refine the output features and obtain the spatial and numerical distribution
of crowd-specific information. Based on these features, we further propose
region-adaptive NMS thresholds and a decouple-then-align paradigm that address
the major limitations of detection-based methods. Our extensive evaluations on
various crowd analysis tasks, including crowd counting, localization, and
detection, demonstrate the effectiveness of utilizing output features and the
potential of detection-based methods in crowd analysis.
- Abstract(参考訳): 検出に基づく手法は,密集した群集における性能の低さから,群集分析では好ましくないと見なされている。
しかし,これらの手法の可能性を過小評価しており,しばしば無視される群集分析に重要な情報を提供している。
具体的には、出力提案とバウンディングボックスの領域サイズと信頼性スコアは、群衆の規模と密度に関する洞察を与える。
これらの機能を活用すべく,既存の検出モデルと容易に統合可能なプラグアンドプレイモジュールであるcrowd hatを提案する。
このモジュールは混合2D-1D圧縮技術を用いて出力特性を洗練し、群衆特有の情報の空間的および数値的分布を得る。
これらの特徴に基づき,領域適応型NMSしきい値と,検出に基づく手法の限界に対処するデコプリ-then-alignパラダイムを提案する。
本研究は, 群集数, 局所化, 検出などの様々な群集分析課題に対する広範な評価を行い, 群集解析におけるアウトプット特性の活用と検出法の可能性を示した。
関連論文リスト
- Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - LLMCount: Enhancing Stationary mmWave Detection with Multimodal-LLM [1.8326853076179552]
LLMCountは,大規模言語モデル(LLM)の機能を活用して,群衆検出性能を向上させる最初のシステムである。
システムの性能を評価するため,ホール,会議室,映画館などの多彩なシナリオ下で総合的な評価を行う。
論文 参考訳(メタデータ) (2024-09-24T16:09:29Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Multi-View Knowledge Distillation from Crowd Annotations for
Out-of-Domain Generalization [53.24606510691877]
本稿では,既存の手法による分布を集約することで,クラウドアノテーションからソフトラベルを取得する新しい手法を提案する。
これらのアグリゲーション手法は、ドメイン外テストセット上の4つのNLPタスクにおいて、最も一貫したパフォーマンスをもたらすことを実証する。
論文 参考訳(メタデータ) (2022-12-19T12:40:18Z) - LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds [103.8635206945196]
視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
論文 参考訳(メタデータ) (2021-10-10T07:55:44Z) - Understanding Failures of Deep Networks via Robust Feature Extraction [44.204907883776045]
本研究では,視覚的特徴を識別し,不在や不在がパフォーマンスの低下を招き,失敗を特徴づけ,説明することを目的とした手法を紹介し,検討する。
我々は、分離されたロバストモデルの表現を活用して、解釈可能な特徴を抽出し、これらの特徴を利用して障害モードを特定します。
論文 参考訳(メタデータ) (2020-12-03T08:33:29Z) - Video Anomaly Detection by Estimating Likelihood of Representations [21.879366166261228]
ビデオ異常は、モーション表現、オブジェクトのローカライゼーション、アクション認識など、多くのサブタスクを解決するため、困難なタスクである。
伝統的に、この課題に対する解決策は、これらの特徴の空間的接続を無視しながら、ビデオフレームとその低次元特徴のマッピングに焦点を当ててきた。
最近のソリューションでは、K-Meansのようなハードクラスタリング技術を用いてこれらの空間的接続を分析することや、潜伏した特徴を一般的な理解にマップするためにニューラルネットワークを適用することに焦点を当てている。
潜在特徴空間における映像異常を解決するために,このタスクを密度推定問題に転送するための深い確率モデルを提案する。
論文 参考訳(メタデータ) (2020-12-02T19:16:22Z) - From Handcrafted to Deep Features for Pedestrian Detection: A Survey [148.35460817092908]
歩行者検出はコンピュータビジョンにおいて重要であるが難しい問題である。
過去10年間で、手作りの機能と深い機能によって、大幅な改善が見られた。
単スペクトル歩行者検出に加えて,多スペクトル歩行者検出も検討した。
論文 参考訳(メタデータ) (2020-10-01T14:51:10Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。