論文の概要: Robust Unsupervised Crowd Counting and Localization with Adaptive
Resolution SAM
- arxiv url: http://arxiv.org/abs/2402.17514v1
- Date: Tue, 27 Feb 2024 13:55:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 16:02:27.287289
- Title: Robust Unsupervised Crowd Counting and Localization with Adaptive
Resolution SAM
- Title(参考訳): アダプティブレゾリューションSAMを用いたロバスト無教師群カウントと位置決め
- Authors: Jia Wan, Qiangqiang Wu, Wei Lin, Antoni B. Chan
- Abstract要約: 本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
- 参考スコア(独自算出の注目度): 61.10712338956455
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The existing crowd counting models require extensive training data, which is
time-consuming to annotate. To tackle this issue, we propose a simple yet
effective crowd counting method by utilizing the Segment-Everything-Everywhere
Model (SEEM), an adaptation of the Segmentation Anything Model (SAM), to
generate pseudo-labels for training crowd counting models. However, our initial
investigation reveals that SEEM's performance in dense crowd scenes is limited,
primarily due to the omission of many persons in high-density areas. To
overcome this limitation, we propose an adaptive resolution SEEM to handle the
scale variations, occlusions, and overlapping of people within crowd scenes.
Alongside this, we introduce a robust localization method, based on Gaussian
Mixture Models, for predicting the head positions in the predicted people
masks. Given the mask and point pseudo-labels, we propose a robust loss
function, which is designed to exclude uncertain regions based on SEEM's
predictions, thereby enhancing the training process of the counting networks.
Finally, we propose an iterative method for generating pseudo-labels. This
method aims at improving the quality of the segmentation masks by identifying
more tiny persons in high-density regions, which are often missed in the first
pseudo-labeling stage. Overall, our proposed method achieves the best
unsupervised performance in crowd counting, while also being comparable results
to some supervised methods. This makes it a highly effective and versatile tool
for crowd counting, especially in situations where labeled data is not
available.
- Abstract(参考訳): 既存のクラウドカウントモデルには、注釈に時間を要する広範なトレーニングデータが必要である。
そこで本研究では,セグメント・allthing-everywhereモデル (seem) を用いて,セグメント・エバンスモデル (sam) の適応化を行い,群衆数を訓練するための擬似ラベルを生成する手法を提案する。
しかし,初回調査の結果,密度の高い地域では多くの人々が欠席しているため,密集した群衆シーンでのbelookのパフォーマンスは限定的であることが判明した。
そこで本研究では,この制限を克服するために,群衆シーンにおける人々のスケール変動,咬合,重なりを対処できる適応型解決法を提案する。
これに加えて,ガウス混合モデルに基づくロバストなローカライズ手法を導入し,予測された人物マスクの頭部位置を予測する。
マスクと点擬似ラベルを仮定し,lookの予測に基づいて不確かでない領域を除外し,計数ネットワークのトレーニングプロセスを強化するロバストな損失関数を提案する。
最後に,擬似ラベルを生成する反復的手法を提案する。
本手法は,第1偽ラベル段階で欠落することが多い高密度領域の小型人物を識別することにより,セグメンテーションマスクの品質を向上させることを目的としている。
総じて,提案手法は群集数において最高の教師なし性能を実現すると同時に,教師なし手法と同等の結果が得られる。
これにより、特にラベル付きデータが利用できない状況において、群衆カウントに非常に効果的で多用途なツールとなる。
関連論文リスト
- Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - Semi-Supervised Crowd Counting with Contextual Modeling: Facilitating Holistic Understanding of Crowd Scenes [19.987151025364067]
本稿では,信頼度の高い群集カウントモデルをトレーニングするための,新しい半教師付き手法を提案する。
モデルの本質的な'サブタイズ'能力を育み、領域の数を正確に見積もることができる。
提案手法は,従来の手法を,挑戦的ベンチマークにおいて大きな差で上回り,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-16T12:42:43Z) - Multi-View Knowledge Distillation from Crowd Annotations for
Out-of-Domain Generalization [53.24606510691877]
本稿では,既存の手法による分布を集約することで,クラウドアノテーションからソフトラベルを取得する新しい手法を提案する。
これらのアグリゲーション手法は、ドメイン外テストセット上の4つのNLPタスクにおいて、最も一貫したパフォーマンスをもたらすことを実証する。
論文 参考訳(メタデータ) (2022-12-19T12:40:18Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - A Three-Stage Self-Training Framework for Semi-Supervised Semantic
Segmentation [0.9786690381850356]
本稿では,セマンティックセグメンテーションのための3段階の自己学習フレームワークとして,包括的解を提案する。
本手法の鍵となる考え方は擬似マスク統計情報の抽出である。
次に、一貫性を強制するマルチタスクモデルを用いて擬似マスクの不確実性を減少させる。
論文 参考訳(メタデータ) (2020-12-01T21:00:27Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z) - Mask-guided sample selection for Semi-Supervised Instance Segmentation [13.091166009687058]
半教師付きインスタンスセグメンテーションのためのアノテートするサンプルを決定するためのサンプル選択手法を提案する。
本手法は, サンプルのラベル付きプールに対する擬似マスクの初回予測と, マスクの質を予測するスコアから構成される。
品質スコアからアノテートしたほうがよいサンプルについて検討し, ランダム選択よりも優れた手法を示す。
論文 参考訳(メタデータ) (2020-08-25T14:44:58Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。