論文の概要: Glance to Count: Learning to Rank with Anchors for Weakly-supervised
Crowd Counting
- arxiv url: http://arxiv.org/abs/2205.14659v1
- Date: Sun, 29 May 2022 13:39:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 14:20:04.852967
- Title: Glance to Count: Learning to Rank with Anchors for Weakly-supervised
Crowd Counting
- Title(参考訳): view to count: 教師の少ない群衆のためのアンカーによるランク付けの学習
- Authors: Zheng Xiong, Liangyu Chai, Wenxi Liu, Yongtuo Liu, Sucheng Ren and
Shengfeng He
- Abstract要約: 群衆の画像は、おそらくアノテートする最も面倒なデータの一つだ。
本稿では,2つの画像と高コントラスト数の2値ランキングをトレーニング指導として活用する,弱教師付きセッティングを提案する。
本研究では,様々な管理手法の組み合わせを研究するために広範囲な実験を行い,提案手法が既存の弱い監督手法よりも大きなマージンで優れていることを示す。
- 参考スコア(独自算出の注目度): 43.446730359817515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowd image is arguably one of the most laborious data to annotate. In this
paper, we devote to reduce the massive demand of densely labeled crowd data,
and propose a novel weakly-supervised setting, in which we leverage the binary
ranking of two images with high-contrast crowd counts as training guidance. To
enable training under this new setting, we convert the crowd count regression
problem to a ranking potential prediction problem. In particular, we tailor a
Siamese Ranking Network that predicts the potential scores of two images
indicating the ordering of the counts. Hence, the ultimate goal is to assign
appropriate potentials for all the crowd images to ensure their orderings obey
the ranking labels. On the other hand, potentials reveal the relative crowd
sizes but cannot yield an exact crowd count. We resolve this problem by
introducing "anchors" during the inference stage. Concretely, anchors are a few
images with count labels used for referencing the corresponding counts from
potential scores by a simple linear mapping function. We conduct extensive
experiments to study various combinations of supervision, and we show that the
proposed method outperforms existing weakly-supervised methods without
additional labeling effort by a large margin.
- Abstract(参考訳): 群衆の画像は、おそらくアノテートする最も面倒なデータの一つだ。
本稿では,高コントラストの群集数を持つ2つの画像のバイナリランキングをトレーニング指導として活用する,高密度ラベル付き群集データの大量需要削減に尽力し,より弱い教師付き設定を提案する。
この新しい環境下でのトレーニングを可能にするために,クラウドカウント回帰問題をランキングポテンシャル予測問題に変換する。
特に、カウントの順序を示す2つの画像の潜在的なスコアを予測する、シャムのランキングネットワークを調整します。
したがって、最終的な目標は、すべての群衆画像に適切なポテンシャルを割り当て、彼らの注文がランキングラベルに従うことを保証することである。
一方、ポテンシャルは相対的な群衆の大きさを示すが、正確な群衆数を得ることはできない。
この問題を推論段階で「アンカー」を導入することで解決する。
具体的には、アンカーは数ラベルを持つ少数の画像であり、単純な線形写像関数によってポテンシャルスコアから対応する数を参照するために使われる。
本研究では,様々な組み合わせの監督を行うための広範囲な実験を行い,提案手法が既存の弱い監督手法よりも高い性能を示すことを示す。
関連論文リスト
- CrowdCLIP: Unsupervised Crowd Counting via Vision-Language Model [60.30099369475092]
監視された群衆のカウントは、高価な手作業によるラベリングに大きく依存している。
本稿では,クラウドカウントのための新しい非教師付きフレームワークであるCrowdCLIPを提案する。
CrowdCLIPは、従来の教師なしの最先端カウント手法と比較して、優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-04-09T12:56:54Z) - Deep Rank-Consistent Pyramid Model for Enhanced Crowd Counting [48.15210212256114]
そこで我々は,大規模未ラベル画像を用いた観客数増大を目的としたDREAM(Deep Rank-consistEnt pyrAmid Model)を提案する。
さらに, トレーニング目的のために4000枚の画像を含む, 未ラベルのクラウドカウントデータセット, FUDAN-UCC を新たに収集した。
論文 参考訳(メタデータ) (2022-01-13T07:25:06Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z) - Fine-Grained Crowd Counting [59.63412475367119]
現在の群衆カウントアルゴリズムは、画像内の人の数にのみ関係している。
本研究では,各個体の低レベル行動特性に基づいて,群集をカテゴリに分類する,きめ細かい群集カウントを提案する。
論文 参考訳(メタデータ) (2020-07-13T01:31:12Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。