論文の概要: CrowdMLP: Weakly-Supervised Crowd Counting via Multi-Granularity MLP
- arxiv url: http://arxiv.org/abs/2203.08219v1
- Date: Tue, 15 Mar 2022 19:57:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 09:19:56.791667
- Title: CrowdMLP: Weakly-Supervised Crowd Counting via Multi-Granularity MLP
- Title(参考訳): CrowdMLP: マルチグラニュラリティMLPによる微妙な群衆カウント
- Authors: Mingjie Wang, Jun Zhou, Hao Cai, Minglun Gong
- Abstract要約: 既存の最先端のクラウドカウントアルゴリズムは、位置レベルのアノテーションに過度に依存している。
CrowdMLPが紹介され、埋め込みのグローバルな依存関係をモデル化し、合計数を削減している。
実験により、CrowdMLPは既存の弱い教師付きカウントアルゴリズムよりも大幅に優れていることが示された。
- 参考スコア(独自算出の注目度): 19.42355176075503
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Existing state-of-the-art crowd counting algorithms rely excessively on
location-level annotations, which are burdensome to acquire. When only
count-level (weak) supervisory signals are available, it is arduous and
error-prone to regress total counts due to the lack of explicit spatial
constraints. To address this issue, a novel and efficient counter (referred to
as CrowdMLP) is presented, which probes into modelling global dependencies of
embeddings and regressing total counts by devising a multi-granularity MLP
regressor. In specific, a locally-focused pre-trained frontend is cascaded to
extract crude feature maps with intrinsic spatial cues, which prevent the model
from collapsing into trivial outcomes. The crude embeddings, along with raw
crowd scenes, are tokenized at different granularity levels. The
multi-granularity MLP then proceeds to mix tokens at the dimensions of
cardinality, channel, and spatial for mining global information. An effective
proxy task, namely Split-Counting, is also proposed to evade the barrier of
limited samples and the shortage of spatial hints in a self-supervised manner.
Extensive experiments demonstrate that CrowdMLP significantly outperforms
existing weakly-supervised counting algorithms and performs on par with
state-of-the-art location-level supervised approaches.
- Abstract(参考訳): 既存の最先端のクラウドカウントアルゴリズムは、場所レベルのアノテーションを過度に頼っている。
カウントレベル(弱)の監視信号しか利用できない場合、明示的な空間的制約が欠如しているため、総カウントを後退させるのは困難で誤りやすい。
この問題に対処するために,マルチグラニュラ性mlpレグレッサを考案し,埋め込みのグローバル依存性のモデル化と総カウントの回帰を探究する,新規かつ効率的なカウンタ(crowdmlp)が提案されている。
具体的には、現地で訓練された事前学習されたフロントエンドをカスケードして、内在的な空間的手がかりを持つ粗い特徴マップを抽出することで、モデルが自明な結果に崩壊することを防ぐ。
粗い埋め込みは、生の群衆のシーンとともに、異なる粒度レベルでトークン化されます。
多粒度MLPは、グローバル情報をマイニングするために、基数、チャネル、空間の次元でトークンを混合する。
限られたサンプルのバリアや空間的ヒントの不足を回避すべく,スプリットカウントという効果的なプロキシタスクも提案されている。
大規模な実験により、CrowdMLPは既存の弱い教師付きカウントアルゴリズムを著しく上回り、最先端のロケーションレベルの教師付きアプローチと同等に機能することが示された。
関連論文リスト
- Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Combating Representation Learning Disparity with Geometric Harmonization [50.29859682439571]
本稿では,表現学習におけるカテゴリレベルの均一性を促進するために,新しい幾何調和法を提案する。
我々の提案はSSLの設定を変更せず、低コストで既存のメソッドに容易に統合できる。
論文 参考訳(メタデータ) (2023-10-26T17:41:11Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Reinforcing Local Feature Representation for Weakly-Supervised Dense
Crowd Counting [21.26385035473938]
本稿では,局所表現の強化を目的とした自己適応型特徴類似性学習ネットワークとグローバル局所整合性損失を提案する。
異なるバックボーンをベースとした提案手法は,弱教師付き群集数と完全教師付き群集数とのギャップを狭める。
論文 参考訳(メタデータ) (2022-02-22T05:53:51Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。