論文の概要: Embodied Crowd Counting
- arxiv url: http://arxiv.org/abs/2503.08367v1
- Date: Tue, 11 Mar 2025 12:23:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:42:49.068582
- Title: Embodied Crowd Counting
- Title(参考訳): Embodied (複数形 Embodieds)
- Authors: Runling Long, Yunlong Wang, Jia Wan, Xiang Deng, Xinting Zhu, Weili Guan, Antoni B. Chan, Liqiang Nie,
- Abstract要約: Embodied Crowd Counting (ECC)は、大規模なシーンと大規模なオブジェクト量を可能にする対話型シミュレータである。
現実的な群集分布を近似した事前確率分布を導入して群集を生成する。
この方法はMLLM駆動の粗大な航法機構を含み、Z軸探索を活発に行うことができる。
- 参考スコア(独自算出の注目度): 86.10533153162476
- License:
- Abstract: Occlusion is one of the fundamental challenges in crowd counting. In the community, various data-driven approaches have been developed to address this issue, yet their effectiveness is limited. This is mainly because most existing crowd counting datasets on which the methods are trained are based on passive cameras, restricting their ability to fully sense the environment. Recently, embodied navigation methods have shown significant potential in precise object detection in interactive scenes. These methods incorporate active camera settings, holding promise in addressing the fundamental issues in crowd counting. However, most existing methods are designed for indoor navigation, showing unknown performance in analyzing complex object distribution in large scale scenes, such as crowds. Besides, most existing embodied navigation datasets are indoor scenes with limited scale and object quantity, preventing them from being introduced into dense crowd analysis. Based on this, a novel task, Embodied Crowd Counting (ECC), is proposed. We first build up an interactive simulator, Embodied Crowd Counting Dataset (ECCD), which enables large scale scenes and large object quantity. A prior probability distribution that approximates realistic crowd distribution is introduced to generate crowds. Then, a zero-shot navigation method (ZECC) is proposed. This method contains a MLLM driven coarse-to-fine navigation mechanism, enabling active Z-axis exploration, and a normal-line-based crowd distribution analysis method for fine counting. Experimental results against baselines show that the proposed method achieves the best trade-off between counting accuracy and navigation cost.
- Abstract(参考訳): 排除は集団カウントにおける基本的な課題の1つである。
コミュニティでは、この問題に対処するために様々なデータ駆動アプローチが開発されているが、その効果は限られている。
これは、ほとんどの既存のクラウドカウントデータセットが受動的カメラに基づいており、環境を完全に感知する能力を制限しているためである。
近年,インタラクティブなシーンにおける正確な物体検出において,具体的ナビゲーション手法が有意な可能性を示唆している。
これらの手法にはアクティブなカメラ設定が含まれており、群衆カウントの基本的な問題に対処する上での約束が守られている。
しかし、既存のほとんどの手法は屋内ナビゲーション用に設計されており、群衆などの大規模シーンにおける複雑な物体分布の分析における未知のパフォーマンスを示している。
さらに、既存のボディー化されたナビゲーションデータセットのほとんどは、室内のシーンで、スケールや物体の量に制限があるため、密集した群衆分析に導入されるのを防いでいる。
これに基づいて,新しいタスクである Embodied Crowd Counting (ECC) が提案されている。
まず,対話型シミュレータEmbodied Crowd Counting Dataset (ECCD)を構築し,大規模シーンと大規模オブジェクト量を実現する。
現実的な群集分布を近似した事前確率分布を導入して群集を生成する。
そこで,ゼロショットナビゲーション法 (ZECC) を提案する。
MLLM駆動の粗大な航法機構を備え、Z軸のアクティブな探索を可能にするとともに、微計数化のための正規線に基づく群集分布解析方法を含む。
ベースラインに対する実験結果から,提案手法は計測精度と航法コストの最良のトレードオフを達成できることが示唆された。
関連論文リスト
- Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Boosting Detection in Crowd Analysis via Underutilized Output Features [8.319283909091595]
群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集
これらの手法の可能性は、しばしば無視される群集分析に重要な情報を提供するため、過小評価されていると我々は主張する。
既存の検出モデルと容易に統合可能なプラグイン・アンド・プレイモジュールであるCrowd Hatを提案する。
論文 参考訳(メタデータ) (2023-08-30T17:59:11Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - A Flow Base Bi-path Network for Cross-scene Video Crowd Understanding in
Aerial View [93.23947591795897]
本稿では,これらの課題に対処し,ドローンから収集した視覚的データから参加者を自動的に理解する。
クロスシーンテストで発生する背景雑音を軽減するために, 二重ストリーム群カウントモデルを提案する。
極暗環境下での集団密度推定問題に対処するために,ゲームグランドセフトオートV(GTAV)によって生成された合成データを導入する。
論文 参考訳(メタデータ) (2020-09-29T01:48:24Z) - Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method [52.182698295053264]
リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。
これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文 参考訳(メタデータ) (2020-08-28T03:47:49Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。