論文の概要: A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds
- arxiv url: http://arxiv.org/abs/2007.12831v3
- Date: Thu, 18 Feb 2021 07:00:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 01:09:15.730937
- Title: A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds
- Title(参考訳): 群集における点監督対象検出と計数のための自己学習手法
- Authors: Yi Wang, Junhui Hou, Xinyu Hou, and Lap-Pui Chau
- Abstract要約: 本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
- 参考スコア(独自算出の注目度): 54.73161039445703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel self-training approach named Crowd-SDNet
that enables a typical object detector trained only with point-level
annotations (i.e., objects are labeled with points) to estimate both the center
points and sizes of crowded objects. Specifically, during training, we utilize
the available point annotations to supervise the estimation of the center
points of objects directly. Based on a locally-uniform distribution assumption,
we initialize pseudo object sizes from the point-level supervisory information,
which are then leveraged to guide the regression of object sizes via a
crowdedness-aware loss. Meanwhile, we propose a confidence and order-aware
refinement scheme to continuously refine the initial pseudo object sizes such
that the ability of the detector is increasingly boosted to detect and count
objects in crowds simultaneously. Moreover, to address extremely crowded
scenes, we propose an effective decoding method to improve the detector's
representation ability. Experimental results on the WiderFace benchmark show
that our approach significantly outperforms state-of-the-art point-supervised
methods under both detection and counting tasks, i.e., our method improves the
average precision by more than 10% and reduces the counting error by 31.2%.
Besides, our method obtains the best results on the crowd counting and
localization datasets (i.e., ShanghaiTech and NWPU-Crowd) and vehicle counting
datasets (i.e., CARPK and PUCPR+) compared with state-of-the-art
counting-by-detection methods. The code will be publicly available at
https://github.com/WangyiNTU/Point-supervised-crowd-detection.
- Abstract(参考訳): 本稿では,ポイントレベルのアノテーション(つまり,オブジェクトはポイントでラベル付けされる)でのみ訓練される一般的な物体検出装置において,混雑した物体の中心点とサイズの両方を推定できる,crowd-sdnetと呼ばれる新しい自己学習手法を提案する。
具体的には、トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点を直接推定する。
局所一様分布の仮定に基づいて、擬似オブジェクトサイズを点レベルの監督情報から初期化し、密集度を意識してオブジェクトサイズの回帰を導出する。
一方,検知器の能力が向上し,同時に群衆の物体を検出して数えるように,初期擬似オブジェクトサイズを継続的に洗練する信頼性と秩序を考慮した改良手法を提案する。
さらに,非常に混み合ったシーンに対処するために,検出器の表現能力を向上させる効果的な復号化手法を提案する。
WiderFaceベンチマークの実験結果から,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法を著しく上回り,平均精度を10%以上向上し,カウントエラーを31.2%削減することがわかった。
さらに, この手法は, 群衆計数・局所化データセット(上海テック, NWPU-Crowd)と車両計数データセット(CARPK, PUCPR+)について, 最先端の計測法と比較して, 最適な結果を得る。
コードはhttps://github.com/WangyiNTU/Point-supervised-crowd-detectionで公開されている。
関連論文リスト
- Dense Center-Direction Regression for Object Counting and Localization with Point Supervision [1.9526430269580954]
本稿では,CeDiRNetと呼ばれる新しい学習手法を提案する。
最寄りの物体中心を向いている方向の高密度な回帰を利用する。
既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-26T17:49:27Z) - SeMoLi: What Moves Together Belongs Together [51.72754014130369]
動作手がかりに基づく半教師付き物体検出に挑戦する。
近年,移動物体の擬似ラベルインスタンスに対して,動きに基づくクラスタリング手法が適用可能であることが示唆された。
我々は、このアプローチを再考し、オブジェクト検出とモーションインスパイアされた擬似ラベルの両方が、データ駆動方式で取り組めることを示唆する。
論文 参考訳(メタデータ) (2024-02-29T18:54:53Z) - Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Few-Shot Keypoint Detection as Task Adaptation via Latent Embeddings [17.04471874483516]
既存のアプローチでは、1つのフォワードパスに密なキーポイントの埋め込みを計算するか、その全容量をスパースポイントのセットに割り当てる。
本稿では,ある時点における関連点数が典型的には少ないという観測に基づいて,中間点を探索する。
私たちの主な貢献は、キーポイント埋め込みでスパーススタイルのネットワークを条件付けることができる、少数ショットタスク適応にインスパイアされた、新しいアーキテクチャです。
論文 参考訳(メタデータ) (2021-12-09T13:25:42Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z) - Learning Object Scale With Click Supervision for Object Detection [29.421113887739413]
本稿では,CNN視覚化をクリック管理に組み込んで擬似地下構造を生成する,シンプルで効果的な手法を提案する。
これらの擬似グラウンドトラスカンは、完全に監視された検出器の訓練に使用される。
PASCAL VOC2007 とVOC 2012 データセットによる実験結果から,提案手法はオブジェクトのスケールを推定する上で,はるかに高い精度が得られることが示された。
論文 参考訳(メタデータ) (2020-02-20T03:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。