論文の概要: Point-to-Region Loss for Semi-Supervised Point-Based Crowd Counting
- arxiv url: http://arxiv.org/abs/2505.21943v1
- Date: Wed, 28 May 2025 03:53:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.404428
- Title: Point-to-Region Loss for Semi-Supervised Point-Based Crowd Counting
- Title(参考訳): 半スーパービジョンのポイントベース集団カウントにおけるポイント・ツー・レギュレーション損失
- Authors: Wei Lin, Chenyang Zhao, Antoni B. Chan,
- Abstract要約: ポイント・ツー・ポイント(P2P)監視スキームを通じて、カウンターを訓練することで、混雑したシーンの歩行者を見つけるためにポイント検出が開発された。
我々は、擬似ラベルに基づく半教師付きカウントフレームワークにポイントベースのメソッドを統合する。
実装中、擬似ラベルに対する信頼度はP2Pを介して背景画素に伝達されない。
本稿では,歩行者に対応する地点を検出するのではなく,地域を分割するP2Pを代替するP2R方式を提案する。
- 参考スコア(独自算出の注目度): 49.165960263166966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point detection has been developed to locate pedestrians in crowded scenes by training a counter through a point-to-point (P2P) supervision scheme. Despite its excellent localization and counting performance, training a point-based counter still faces challenges concerning annotation labor: hundreds to thousands of points are required to annotate a single sample capturing a dense crowd. In this paper, we integrate point-based methods into a semi-supervised counting framework based on pseudo-labeling, enabling the training of a counter with only a few annotated samples supplemented by a large volume of pseudo-labeled data. However, during implementation, the training encounters issues as the confidence for pseudo-labels fails to be propagated to background pixels via the P2P. To tackle this challenge, we devise a point-specific activation map (PSAM) to visually interpret the phenomena occurring during the ill-posed training. Observations from the PSAM suggest that the feature map is excessively activated by the loss for unlabeled data, causing the decoder to misinterpret these over-activations as pedestrians. To mitigate this issue, we propose a point-to-region (P2R) scheme to substitute P2P, which segments out local regions rather than detects a point corresponding to a pedestrian for supervision. Consequently, pixels in the local region can share the same confidence with the corresponding pseudo points. Experimental results in both semi-supervised counting and unsupervised domain adaptation highlight the advantages of our method, illustrating P2R can resolve issues identified in PSAM. The code is available at https://github.com/Elin24/P2RLoss.
- Abstract(参考訳): ポイント・ツー・ポイント(P2P)監視スキームを通じて、カウンターを訓練することで、混雑したシーンの歩行者を見つけるためにポイント検出が開発された。
優れたローカライゼーションと計数性能にもかかわらず、ポイントベースのカウンタのトレーニングは、注釈労働に関する課題に直面している。
本稿では,擬似ラベルをベースとした半教師付きカウントフレームワークにポイントベースの手法を統合することで,擬似ラベルデータに補足された少数の注釈付きサンプルによるカウンタのトレーニングを可能にする。
しかし、実装中、擬似ラベルの信頼性がP2Pを介して背景画素に伝達されないため、トレーニングは問題に遭遇する。
この課題に対処するために、不適切なトレーニング中に発生する現象を視覚的に解釈するポイント固有アクティベーションマップ(PSAM)を考案した。
PSAMの観測によると、特徴マップはラベルのないデータの喪失によって過剰に活性化され、デコーダはこれらの過剰な動作を歩行者として解釈する。
この問題を解決するために,歩行者に対応する地点を検出するのではなく,地域を分割するP2Pを代替するP2R方式を提案する。
これにより、局所領域の画素は対応する擬似点と同一の信頼を共有できる。
半教師付きカウントと非教師付きドメイン適応の両方の実験結果が,本手法の利点を浮き彫りにしている。
コードはhttps://github.com/Elin24/P2RLossで入手できる。
関連論文リスト
- Spatial regularisation for improved accuracy and interpretability in keypoint-based registration [5.286949071316761]
教師なしキーポイント検出に基づく最近のアプローチは、解釈可能性に非常に有望である。
本稿では,特徴量の空間分布を正規化するための3倍の損失を提案する。
我々の損失は特徴の解釈可能性を大幅に改善し、現在では正確で解剖学的に意味のあるランドマークに対応しています。
論文 参考訳(メタデータ) (2025-03-06T14:48:25Z) - Quantity-Aware Coarse-to-Fine Correspondence for Image-to-Point Cloud
Registration [4.954184310509112]
Image-to-point cloud registrationは、RGBイメージと参照ポイントクラウドの間の相対カメラのポーズを決定することを目的としている。
個々の点と画素とのマッチングは、モダリティギャップによって本質的に曖昧である。
本稿では,局所点集合と画素パッチ間の量認識対応を捉える枠組みを提案する。
論文 参考訳(メタデータ) (2023-07-14T03:55:54Z) - Focus for Free in Density-Based Counting [56.961229110268036]
利用可能なポイントアノテーションを再利用して、カウント性能を向上させる2つの方法を紹介します。
1つ目は、ポイントアノテーションを利用して、入力画像と密度画像の両方で隠蔽されたオブジェクトをシミュレートするカウント固有の拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
論文 参考訳(メタデータ) (2023-06-08T11:54:37Z) - Point-Teaching: Weakly Semi-Supervised Object Detection with Point
Annotations [81.02347863372364]
本稿では,弱い半教師付きオブジェクト検出フレームワークであるPoint-Teachingを提案する。
具体的には,ポイントアノテート画像の擬似ラベルを生成するためのハンガリーの点マッチング手法を提案する。
そこで本研究では,不整合点の影響を低減するため,単純なyet- effective data augmentation(ポイント誘導コピーペースト)を提案する。
論文 参考訳(メタデータ) (2022-06-01T07:04:38Z) - Object Localization under Single Coarse Point Supervision [107.46800858130658]
本稿では,粗い点アノテーションを用いたPOL手法を提案する。
CPRは、ポイントバッグを構築し、セマンティック関連点を選択し、マルチインスタンス学習(MIL)を通してセマンティックセンターポイントを生成する。
このようにして、CPRは、粗い点監督の下で高性能オブジェクトローカライザのトレーニングを保証する、弱い制御された進化手順を定義する。
論文 参考訳(メタデータ) (2022-03-17T14:14:11Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - BRUL\`E: Barycenter-Regularized Unsupervised Landmark Extraction [2.2758845733923687]
画像特徴の教師なし検索は、アノテーションが欠けている、あるいは不足している多くのコンピュータビジョンタスクにとって不可欠である。
画像中のランドマークを検出するための教師なしの新たなアプローチを提案し,人間の顔のキーポイント抽出の一般的なタスク上で検証する。
提案手法は,非重要情報を捨てつつ,潜在空間における所望のランドマークを自動エンコードする手法に基づく。
論文 参考訳(メタデータ) (2020-06-20T20:04:00Z) - Pose-guided Visible Part Matching for Occluded Person ReID [80.81748252960843]
本稿では、ポーズ誘導による特徴の識別を共同で学習し、その部分の可視性を自己判断する Pose-Guided Visible Part Matching (PVPM) 法を提案する。
実験結果から,提案手法は最先端手法と競合する性能を示した。
論文 参考訳(メタデータ) (2020-04-01T04:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。