論文の概要: Dense Center-Direction Regression for Object Counting and Localization with Point Supervision
- arxiv url: http://arxiv.org/abs/2408.14457v1
- Date: Mon, 26 Aug 2024 17:49:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 13:02:15.452300
- Title: Dense Center-Direction Regression for Object Counting and Localization with Point Supervision
- Title(参考訳): 点スーパービジョンを用いた物体カウントと位置決めのためのDense Center-Direction Regression
- Authors: Domen Tabernik, Jon Muhovič, Danijel Skočaj,
- Abstract要約: 本稿では,CeDiRNetと呼ばれる新しい学習手法を提案する。
最寄りの物体中心を向いている方向の高密度な回帰を利用する。
既存の最先端手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 1.9526430269580954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object counting and localization problems are commonly addressed with point supervised learning, which allows the use of less labor-intensive point annotations. However, learning based on point annotations poses challenges due to the high imbalance between the sets of annotated and unannotated pixels, which is often treated with Gaussian smoothing of point annotations and focal loss. However, these approaches still focus on the pixels in the immediate vicinity of the point annotations and exploit the rest of the data only indirectly. In this work, we propose a novel approach termed CeDiRNet for point-supervised learning that uses a dense regression of directions pointing towards the nearest object centers, i.e. center-directions. This provides greater support for each center point arising from many surrounding pixels pointing towards the object center. We propose a formulation of center-directions that allows the problem to be split into the domain-specific dense regression of center-directions and the final localization task based on a small, lightweight, and domain-agnostic localization network that can be trained with synthetic data completely independent of the target domain. We demonstrate the performance of the proposed method on six different datasets for object counting and localization, and show that it outperforms the existing state-of-the-art methods. The code is accessible on GitHub at https://github.com/vicoslab/CeDiRNet.git.
- Abstract(参考訳): オブジェクトのカウントとローカライゼーションの問題は、一般に、少ない労働集約的なポイントアノテーションの使用を可能にするポイント教師付き学習で対処される。
しかし、点アノテーションに基づく学習は、点アノテーションのガウス的滑らか化と焦点損失でしばしば扱われる、注釈付き画素と注釈なし画素のセット間の高不均衡により、課題を生じさせる。
しかし、これらのアプローチは依然としてポイントアノテーションのすぐ近くにあるピクセルに焦点を合わせており、データの残りを間接的にのみ利用している。
本研究では,最も近い物体中心,すなわち中心方向を向けた方向の高密度回帰を用いた点教師あり学習のためのCeDiRNetという新しい手法を提案する。
これにより、周囲の多くのピクセルから引き起こされる各中心点がオブジェクト中心に向かって大きく支持される。
本稿では, 対象領域から完全に独立した合成データで学習可能な, 小型で軽量かつドメインに依存しない局所化ネットワークに基づいて, 中心方向のドメイン固有密度回帰と最終位置化タスクに分割できる中心方向の定式化を提案する。
オブジェクトカウントとローカライゼーションのための6つの異なるデータセット上で提案手法の性能を実証し,既存の最先端手法よりも優れていることを示す。
コードはGitHubでhttps://github.com/vicoslab/CeDiRNet.gitで公開されている。
関連論文リスト
- CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - Object Localization under Single Coarse Point Supervision [107.46800858130658]
本稿では,粗い点アノテーションを用いたPOL手法を提案する。
CPRは、ポイントバッグを構築し、セマンティック関連点を選択し、マルチインスタンス学習(MIL)を通してセマンティックセンターポイントを生成する。
このようにして、CPRは、粗い点監督の下で高性能オブジェクトローカライザのトレーニングを保証する、弱い制御された進化手順を定義する。
論文 参考訳(メタデータ) (2022-03-17T14:14:11Z) - Few-Shot Keypoint Detection as Task Adaptation via Latent Embeddings [17.04471874483516]
既存のアプローチでは、1つのフォワードパスに密なキーポイントの埋め込みを計算するか、その全容量をスパースポイントのセットに割り当てる。
本稿では,ある時点における関連点数が典型的には少ないという観測に基づいて,中間点を探索する。
私たちの主な貢献は、キーポイント埋め込みでスパーススタイルのネットワークを条件付けることができる、少数ショットタスク適応にインスパイアされた、新しいアーキテクチャです。
論文 参考訳(メタデータ) (2021-12-09T13:25:42Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - Robust Kernel-based Feature Representation for 3D Point Cloud Analysis
via Circular Graph Convolutional Network [2.42919716430661]
本稿では,回転,密度,スケール変動に堅牢な新しい局所特徴記述法を提案する。
局所記述子の表現を改善するために,グローバルアグリゲーション手法を提案する。
本手法は最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2020-12-22T18:02:57Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。