論文の概要: WSCF-MVCC: Weakly-supervised Calibration-free Multi-view Crowd Counting
- arxiv url: http://arxiv.org/abs/2512.02359v1
- Date: Tue, 02 Dec 2025 03:07:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.697348
- Title: WSCF-MVCC: Weakly-supervised Calibration-free Multi-view Crowd Counting
- Title(参考訳): WSCF-MVCC: 弱監督型キャリブレーションフリーマルチビュー・クラウドカウント
- Authors: Bin Li, Daijie Chen, Qi Zhang,
- Abstract要約: 多視点の群集カウントは、単一画像の群集カウントで一般的に発生する閉塞問題を効果的に軽減することができる。
既存のディープラーニング多視点群衆カウント手法では、異なるカメラビューイメージを共通の空間に投影し、地上平面密度マップを得る。
本稿では,キャリブレーションのないマルチビュー・クラウドカウント手法を提案する。
- 参考スコア(独自算出の注目度): 10.758049886638721
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multi-view crowd counting can effectively mitigate occlusion issues that commonly arise in single-image crowd counting. Existing deep-learning multi-view crowd counting methods project different camera view images onto a common space to obtain ground-plane density maps, requiring abundant and costly crowd annotations and camera calibrations. Hence, calibration-free methods are proposed that do not require camera calibrations and scene-level crowd annotations. However, existing calibration-free methods still require expensive image-level crowd annotations for training the single-view counting module. Thus, in this paper, we propose a weakly-supervised calibration-free multi-view crowd counting method (WSCF-MVCC), directly using crowd count as supervision for the single-view counting module rather than density maps constructed from crowd annotations. Instead, a self-supervised ranking loss that leverages multi-scale priors is utilized to enhance the model's perceptual ability without additional annotation costs. What's more, the proposed model leverages semantic information to achieve a more accurate view matching and, consequently, a more precise scene-level crowd count estimation. The proposed method outperforms the state-of-the-art methods on three widely used multi-view counting datasets under weakly supervised settings, indicating that it is more suitable for practical deployment compared with calibrated methods. Code is released in https://github.com/zqyq/Weakly-MVCC.
- Abstract(参考訳): 多視点の群集カウントは、単一画像の群集カウントで一般的に発生する閉塞問題を効果的に軽減することができる。
既存のディープラーニング・マルチビュー・クラウドカウント手法では、さまざまなカメラビューイメージを共通の空間に投影して地上の密度マップを得ることができ、大量のクラウドアノテーションとカメラキャリブレーションを必要とする。
そのため,カメラキャリブレーションやシーンレベルの群衆アノテーションを必要としないキャリブレーションフリー手法が提案されている。
しかし、既存のキャリブレーションフリーの手法では、単一のビューカウントモジュールをトレーニングするために高価な画像レベルのクラウドアノテーションが必要である。
そこで本稿では, 群衆アノテーションから構築した密度マップではなく, 単一視点カウントモジュールの監督として, 群衆カウントを直接利用した, 校正不要なマルチビューカウント手法 (WSCF-MVCC) を提案する。
代わりに、マルチスケールの事前情報を活用する自己監督型ランキング損失を使用して、追加のアノテーションコストを伴わずに、モデルの知覚能力を高める。
さらに、提案モデルでは、セマンティック情報を利用して、より正確なビューマッチングを実現し、その結果、より正確なシーンレベルの観客数推定を行う。
提案手法は,弱教師付き設定下で広く使用されている3つのマルチビューカウントデータセットに対して最先端の手法より優れており,校正手法と比較して実用的配置に適していることを示す。
コードはhttps://github.com/zqyq/Weakly-MVCCで公開されている。
関連論文リスト
- Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Cross-View Cross-Scene Multi-View Crowd Counting [56.83882084112913]
従来,複数カメラを用いて1台のカメラの視野を拡大する手法が提案されてきた。
任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウント・パラダイムを提案する。
論文 参考訳(メタデータ) (2022-05-03T15:03:44Z) - Deep Rank-Consistent Pyramid Model for Enhanced Crowd Counting [48.15210212256114]
そこで我々は,大規模未ラベル画像を用いた観客数増大を目的としたDREAM(Deep Rank-consistEnt pyrAmid Model)を提案する。
さらに, トレーニング目的のために4000枚の画像を含む, 未ラベルのクラウドカウントデータセット, FUDAN-UCC を新たに収集した。
論文 参考訳(メタデータ) (2022-01-13T07:25:06Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - Unsupervised Learning of Visual Features by Contrasting Cluster
Assignments [57.33699905852397]
ペア比較の計算を必要とせず,コントラスト的手法を生かしたオンラインアルゴリズムSwaVを提案する。
本手法では,クラスタ割り当て間の一貫性を保ちながら,同時にデータをクラスタ化する。
我々の方法は大規模で小さなバッチで訓練でき、無制限のデータにスケールできる。
論文 参考訳(メタデータ) (2020-06-17T14:00:42Z) - Towards Using Count-level Weak Supervision for Crowd Counting [55.58468947486247]
本稿では,少数の位置レベルのアノテーション(十分に教師された)と大量のカウントレベルのアノテーション(弱教師付き)からモデルを学習する,弱教師付き群集カウントの問題について検討する。
我々は、生成した密度マップの自由を制限するための正規化を構築するために、単純なyet効果のトレーニング戦略、すなわちMultiple Auxiliary Tasks Training (MATT)を考案した。
論文 参考訳(メタデータ) (2020-02-29T02:58:36Z) - ZoomCount: A Zooming Mechanism for Crowd Counting in Static Images [22.387393675233124]
現在のアプローチでは、大規模な群衆の多様性をうまく扱えず、極端な場合では性能が良くない。
提案手法は,このような極端な事例の検出と処理が,より優れた群集推定につながるという観測に基づいている。
論文 参考訳(メタデータ) (2020-02-27T16:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。