論文の概要: Focus for Free in Density-Based Counting
- arxiv url: http://arxiv.org/abs/2306.05129v1
- Date: Thu, 8 Jun 2023 11:54:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-06-09 14:34:06.977918
- Title: Focus for Free in Density-Based Counting
- Title(参考訳): 密度計数の自由化のためのフォーカス
- Authors: Zenglin Shi, Pascal Mettes, Cees G.M. Snoek
- Abstract要約: 利用可能なポイントアノテーションを再利用して、カウント性能を向上させる2つの方法を紹介します。
1つ目は、ポイントアノテーションを利用して、入力画像と密度画像の両方で隠蔽されたオブジェクトをシミュレートするカウント固有の拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
- 参考スコア(独自算出の注目度): 56.961229110268036
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This work considers supervised learning to count from images and their
corresponding point annotations. Where density-based counting methods typically
use the point annotations only to create Gaussian-density maps, which act as
the supervision signal, the starting point of this work is that point
annotations have counting potential beyond density map generation. We introduce
two methods that repurpose the available point annotations to enhance counting
performance. The first is a counting-specific augmentation that leverages point
annotations to simulate occluded objects in both input and density images to
enhance the network's robustness to occlusions. The second method, foreground
distillation, generates foreground masks from the point annotations, from which
we train an auxiliary network on images with blacked-out backgrounds. By doing
so, it learns to extract foreground counting knowledge without interference
from the background. These methods can be seamlessly integrated with existing
counting advances and are adaptable to different loss functions. We demonstrate
complementary effects of the approaches, allowing us to achieve robust counting
results even in challenging scenarios such as background clutter, occlusion,
and varying crowd densities. Our proposed approach achieves strong counting
results on multiple datasets, including ShanghaiTech Part\_A and Part\_B,
UCF\_QNRF, JHU-Crowd++, and NWPU-Crowd.
- Abstract(参考訳): この研究は、教師あり学習を画像とその対応するポイントアノテーションから数えることを検討する。
密度に基づくカウント法は、通常、ガウス密度マップを作成するためにのみポイントアノテーションを使用するが、これは監督信号として振る舞う。
利用可能なポイントアノテーションを再利用してカウント性能を向上させる2つの方法を紹介する。
1つはポイントアノテーションを利用して入力画像と密度画像の両方のオクルードオブジェクトをシミュレートし、ネットワークのオクルージョンに対するロバスト性を高めるカウント専用拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
これにより、背景から干渉することなく前景カウント知識を抽出することを学ぶ。
これらの方法は既存の数え上げの進歩とシームレスに統合でき、異なる損失関数に適応できる。
提案手法の補完効果を実証し,背景乱雑,隠蔽,群集密度の変動といった難題においても,頑健なカウント結果が得られることを示した。
提案手法は,上海Tech Part\_A,Part\_B,UCF\_QNRF,JHU-Crowd++,NWPU-Crowdなど,複数のデータセットに対して高いカウント結果が得られる。
関連論文リスト
- Multimodal Point Cloud Semantic Segmentation With Virtual Point Enhancement [10.188196569056332]
LiDARベースの3Dポイントクラウド認識は、様々なアプリケーションで有用であることが証明されている。
空間と密度の変化は、複雑な物体の詳細を捉える上で大きな課題となる。
仮想ポイントエンハンスメントに基づくマルチモーダルポイントクラウドセマンティックセマンティックセマンティックス法を提案する。
論文 参考訳(メタデータ) (2025-04-02T08:02:06Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - Self-Supervised Arbitrary-Scale Point Clouds Upsampling via Implicit
Neural Representation [79.60988242843437]
そこで本研究では,自己監督型および倍率フレキシブルな点雲を同時にアップサンプリングする手法を提案する。
実験結果から, 自己教師あり学習に基づく手法は, 教師あり学習に基づく手法よりも, 競争力や性能が向上することが示された。
論文 参考訳(メタデータ) (2022-04-18T07:18:25Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z) - Towards Using Count-level Weak Supervision for Crowd Counting [55.58468947486247]
本稿では,少数の位置レベルのアノテーション(十分に教師された)と大量のカウントレベルのアノテーション(弱教師付き)からモデルを学習する,弱教師付き群集カウントの問題について検討する。
我々は、生成した密度マップの自由を制限するための正規化を構築するために、単純なyet効果のトレーニング戦略、すなわちMultiple Auxiliary Tasks Training (MATT)を考案した。
論文 参考訳(メタデータ) (2020-02-29T02:58:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。