論文の概要: MMDEW: Multipurpose Multiclass Density Estimation in the Wild
- arxiv url: http://arxiv.org/abs/2510.02213v1
- Date: Thu, 02 Oct 2025 16:57:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.233815
- Title: MMDEW: Multipurpose Multiclass Density Estimation in the Wild
- Title(参考訳): MMDEW:野生における多目的多クラス密度推定
- Authors: Villanelle O'Reilly, Jonathan Cox, Georgios Leontidis, Marc Hanheide, Petra Bosilj, James Brown,
- Abstract要約: 密度マップ推定は、離散的なカウント・バイ・ディテクト法が失敗する密集・隠蔽シーンにおけるオブジェクト数を推定するために用いられる。
本稿では,Twinsのピラミッド・ビジョン・トランスフォーマー・バックボーンと,最先端のマルチスケールデコードアプローチに基づいて構築された特殊化されたマルチクラスカウントヘッドを利用するマルチカテゴリカウントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.382004107282676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Density map estimation can be used to estimate object counts in dense and occluded scenes where discrete counting-by-detection methods fail. We propose a multicategory counting framework that leverages a Twins pyramid vision-transformer backbone and a specialised multi-class counting head built on a state-of-the-art multiscale decoding approach. A two-task design adds a segmentation-based Category Focus Module, suppressing inter-category cross-talk at training time. Training and evaluation on the VisDrone and iSAID benchmarks demonstrates superior performance versus prior multicategory crowd-counting approaches (33%, 43% and 64% reduction to MAE), and the comparison with YOLOv11 underscores the necessity of crowd counting methods in dense scenes. The method's regional loss opens up multi-class crowd counting to new domains, demonstrated through the application to a biodiversity monitoring dataset, highlighting its capacity to inform conservation efforts and enable scalable ecological insights.
- Abstract(参考訳): 密度マップ推定は、離散的なカウント・バイ・ディテクト法が失敗する密集・隠蔽シーンにおけるオブジェクト数を推定するために用いられる。
本稿では,Twinsのピラミッド・ビジョン・トランスフォーマー・バックボーンと,最先端のマルチスケールデコード・アプローチに基づいて構築された特殊化されたマルチクラスカウント・ヘッドを利用するマルチカテゴリカウント・フレームワークを提案する。
2タスク設計ではセグメンテーションベースのカテゴリフォーカスモジュールが追加され、トレーニング時にカテゴリ間クロストークが抑制される。
VisDroneとiSAIDベンチマークのトレーニングと評価は、事前のマルチカテゴリのクラウドカウントアプローチ(33%、43%、64%のMAE削減)よりも優れたパフォーマンスを示しており、YOLOv11との比較は、密集したシーンにおけるクラウドカウント手法の必要性を強調している。
この手法の地域的損失は、新しいドメインに数えられるマルチクラスの群衆を開放し、生物多様性モニタリングデータセットへの応用を通じて、保護活動の通知能力を強調し、スケーラブルな生態学的洞察を可能にすることを実証する。
関連論文リスト
- ProgRoCC: A Progressive Approach to Rough Crowd Counting [66.09510514180593]
私たちはRough Crowd Countingというラベルを付け、取得が容易なトレーニングデータに基づいて精度を向上します。
本稿では,ProgRoCCと呼ばれるCLIPに基づく大群カウント問題に対するアプローチを提案する。
具体的には、粗大なアプローチによってオブジェクト数を決定するプログレッシブな推定学習戦略を導入する。
論文 参考訳(メタデータ) (2025-04-18T01:57:42Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Towards Generalized Multi-stage Clustering: Multi-view Self-distillation [10.368796552760571]
既存のマルチステージクラスタリング手法は、独立して複数のビューから健全な特徴を学習し、クラスタリングタスクを実行する。
本稿では,多視点自己蒸留(DistilMVC)を導入し,ラベル分布の暗黒知識を抽出する多段階深層MVCフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-29T03:35:34Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - A Three-Stage Self-Training Framework for Semi-Supervised Semantic
Segmentation [0.9786690381850356]
本稿では,セマンティックセグメンテーションのための3段階の自己学習フレームワークとして,包括的解を提案する。
本手法の鍵となる考え方は擬似マスク統計情報の抽出である。
次に、一貫性を強制するマルチタスクモデルを用いて擬似マスクの不確実性を減少させる。
論文 参考訳(メタデータ) (2020-12-01T21:00:27Z) - A Strong Baseline for Crowd Counting and Unsupervised People
Localization [2.690502103971799]
本研究では,クラウドカウントのための強力なベースラインと,推定密度マップに基づく非教師なしの人物ローカライゼーションアルゴリズムについて検討する。
さまざまなバックボーンを収集して,その変更の影響を評価します。
そこで本研究では,KMeansと命名されたクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-07T08:29:03Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。