論文の概要: ANTHROPOS-V: benchmarking the novel task of Crowd Volume Estimation
- arxiv url: http://arxiv.org/abs/2501.01877v1
- Date: Fri, 03 Jan 2025 15:57:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-06 15:11:27.793007
- Title: ANTHROPOS-V: benchmarking the novel task of Crowd Volume Estimation
- Title(参考訳): ANTHROPOS-V: クラウドボリューム推定の新しいタスクのベンチマーク
- Authors: Luca Collorone, Stefano D'Arrigo, Massimiliano Pappa, Guido Maria D'Amely di Melendugno, Giovanni Ficarra, Fabio Galasso,
- Abstract要約: 本稿では,RGB画像のみを用いて,群集の集合体容積を推定する手法として,群集容積推定(imation)という新たなタスクを導入する。
イベント管理と公共安全に加えて、CVEは体重の近似、インフラのストレスアセスメントのような重量に敏感なアプリケーションのロック解除、重量バランスの確保にも役立てることができる。
本稿では,様々な都市環境における群衆を対象とする合成ビデオデータセットであるANTHROPOS-Vを用いたCVEの最初のベンチマークを提案する。
- 参考スコア(独自算出の注目度): 5.422528501777117
- License:
- Abstract: We introduce the novel task of Crowd Volume Estimation (CVE), defined as the process of estimating the collective body volume of crowds using only RGB images. Besides event management and public safety, CVE can be instrumental in approximating body weight, unlocking weight sensitive applications such as infrastructure stress assessment, and assuring even weight balance. We propose the first benchmark for CVE, comprising ANTHROPOS-V, a synthetic photorealistic video dataset featuring crowds in diverse urban environments. Its annotations include each person's volume, SMPL shape parameters, and keypoints. Also, we explore metrics pertinent to CVE, define baseline models adapted from Human Mesh Recovery and Crowd Counting domains, and propose a CVE specific methodology that surpasses baselines. Although synthetic, the weights and heights of individuals are aligned with the real-world population distribution across genders, and they transfer to the downstream task of CVE from real images. Benchmark and code are available at github.com/colloroneluca/Crowd-Volume-Estimation.
- Abstract(参考訳): 本稿では,RGB画像のみを用いて,群集の集合体容積を推定するプロセスとして定義された,群集容積推定(CVE)の新たなタスクを紹介する。
イベント管理と公共安全に加えて、CVEは体重の近似、インフラのストレスアセスメントのような重量に敏感なアプリケーションのロック解除、重量バランスの確保にも役立てることができる。
本稿では,様々な都市環境における群衆を対象とする合成フォトリアリスティックビデオデータセットであるANTHROPOS-Vを用いたCVEの最初のベンチマークを提案する。
アノテーションには、各人のボリューム、SMPL形状パラメータ、キーポイントが含まれる。
また、CVEに関連するメトリクスを調査し、Human Mesh RecoveryとCrowd Countingドメインから適応したベースラインモデルを定義し、ベースラインを超えるCVE固有の方法論を提案する。
合成されているものの、個人の体重と身長は、性別間で現実世界の人口分布と一致しており、実際の画像からCVEの下流のタスクに移動する。
ベンチマークとコードはgithub.com/colloroneluca/Crowd-Volume-Estimationで入手できる。
関連論文リスト
- Revisiting Few-Shot Object Detection with Vision-Language Models [49.79495118650838]
我々は、最近の基礎視覚言語モデル(VLM)の文脈で、少数ショットオブジェクト検出(FSOD)のタスクを再考する。
我々は,任意の外部データ上で事前学習された検出器を評価する新しいベンチマークプロトコルであるFoundational FSODを提案する。
CVPR 2024 Foundational FSOD コンペティションについて論じ,コミュニティからの洞察を共有した。
論文 参考訳(メタデータ) (2023-12-22T07:42:00Z) - TSMD: A Database for Static Color Mesh Quality Assessment Study [24.702740013624613]
テクスチャマップを備えた静的メッシュは、現代の工業や製造業で広く利用されている。
静的メッシュ圧縮アルゴリズムと客観的品質指標の研究を容易にするため、Tencent - Static Meshデータセットを作成します。
210個の歪んだサンプルは、多角形静的メッシュ符号化におけるCall for Proposalsのために開発された損失圧縮スキームによって生成される。
論文 参考訳(メタデータ) (2023-08-03T02:19:20Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z) - ClusterVO: Clustering Moving Instances and Estimating Visual Odometry
for Self and Surroundings [54.33327082243022]
ClusterVOはステレオビジュアルオドメトリーで、エゴと周囲の固いクラスタ/オブジェクトの両方の動きを同時にクラスタし、推定する。
以前のソリューションでは、バッチ入力やシーン構造や動的オブジェクトモデルへの事前の指示に頼っていたが、ClusterVOは一般的にオンラインであり、屋内のシーン理解や自律運転など、さまざまなシナリオで使用することができる。
論文 参考訳(メタデータ) (2020-03-29T09:06:28Z) - CNN-based Density Estimation and Crowd Counting: A Survey [65.06491415951193]
本稿では,主にCNNに基づく密度マップ推定法において,群集数モデルについて包括的に検討する。
評価指標から, 観客数データセットで上位3人のパフォーマーを選択した。
我々は、今後のクラウドカウントの展開について、合理的な推測と予測を行うことを期待する。
論文 参考訳(メタデータ) (2020-03-28T13:17:30Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。