論文の概要: Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation
- arxiv url: http://arxiv.org/abs/2007.02846v4
- Date: Mon, 3 Aug 2020 06:14:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 02:44:19.445456
- Title: Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation
- Title(参考訳): オブジェクト検出、インスタンス分割、ポーズ推定のためのポイントセットアンカー
- Authors: Fangyun Wei, Xiao Sun, Hongyang Li, Jingdong Wang, Stephen Lin
- Abstract要約: 中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
- 参考スコア(独自算出の注目度): 85.96410825961966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A recent approach for object detection and human pose estimation is to
regress bounding boxes or human keypoints from a central point on the object or
person. While this center-point regression is simple and efficient, we argue
that the image features extracted at a central point contain limited
information for predicting distant keypoints or bounding box boundaries, due to
object deformation and scale/orientation variation. To facilitate inference, we
propose to instead perform regression from a set of points placed at more
advantageous positions. This point set is arranged to reflect a good
initialization for the given task, such as modes in the training data for pose
estimation, which lie closer to the ground truth than the central point and
provide more informative features for regression. As the utility of a point set
depends on how well its scale, aspect ratio and rotation matches the target, we
adopt the anchor box technique of sampling these transformations to generate
additional point-set candidates. We apply this proposed framework, called
Point-Set Anchors, to object detection, instance segmentation, and human pose
estimation. Our results show that this general-purpose approach can achieve
performance competitive with state-of-the-art methods for each of these tasks.
Code is available at \url{https://github.com/FangyunWei/PointSetAnchor}
- Abstract(参考訳): オブジェクト検出と人間のポーズ推定に対する最近のアプローチは、境界ボックスや人間のキーポイントをオブジェクトや人の中心から引き戻すことである。
この中心点回帰は単純かつ効率的であるが、中心点から抽出された画像の特徴は、物体の変形とスケール/オリエンテーションの変動により、遠方のキーポイントやボックス境界を予測するための限られた情報を含んでいる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
この点集合は、ポーズ推定のための訓練データにおけるモードのような、与えられたタスクの適切な初期化を反映して配置され、中心点よりも基底真理に近い位置にあり、回帰のためのより有益な特徴を提供する。
点集合の有用性は、そのスケール、アスペクト比、回転が目標とどの程度合っているかに依存するため、これらの変換をサンプリングして追加の点集合候補を生成するアンカーボックス技術を採用する。
我々は、この提案フレームワークであるpoint-set anchorsを、オブジェクト検出、インスタンスセグメンテーション、人間のポーズ推定に適用する。
以上の結果から,この汎用手法は各タスクの最先端手法と競合する性能を達成できることが示唆された。
コードは \url{https://github.com/FangyunWei/PointSetAnchor} で入手できる。
関連論文リスト
- Dense Center-Direction Regression for Object Counting and Localization with Point Supervision [1.9526430269580954]
本稿では,CeDiRNetと呼ばれる新しい学習手法を提案する。
最寄りの物体中心を向いている方向の高密度な回帰を利用する。
既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-26T17:49:27Z) - LanePtrNet: Revisiting Lane Detection as Point Voting and Grouping on
Curves [8.037214110171123]
車線検出は、自動運転の分野において重要な役割を果たす。
本稿では,順序付き集合上での点投票とグループ化のプロセスとしてレーン検出を扱う新しいアプローチであるLanePtrNetを提案する。
提案手法の有効性を検証するための総合的な実験を行い,その性能を実証した。
論文 参考訳(メタデータ) (2024-03-08T08:45:42Z) - PointOBB: Learning Oriented Object Detection via Single Point
Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。
PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。
DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2023-11-23T15:51:50Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Few-Shot Keypoint Detection as Task Adaptation via Latent Embeddings [17.04471874483516]
既存のアプローチでは、1つのフォワードパスに密なキーポイントの埋め込みを計算するか、その全容量をスパースポイントのセットに割り当てる。
本稿では,ある時点における関連点数が典型的には少ないという観測に基づいて,中間点を探索する。
私たちの主な貢献は、キーポイント埋め込みでスパーススタイルのネットワークを条件付けることができる、少数ショットタスク適応にインスパイアされた、新しいアーキテクチャです。
論文 参考訳(メタデータ) (2021-12-09T13:25:42Z) - Oriented RepPoints for Aerial Object Detection [10.818838437018682]
本稿では,オブジェクト指向RepPointsという,空中物体検出のための新しい手法を提案する。
具体的には、任意指向オブジェクトの幾何学的および空間的情報を取得するために、適応点の集合を用いることを提案する。
教師付き学習を容易にするために,適応点を配向境界ボックスに明示的にマッピングする指向変換関数を提案する。
論文 参考訳(メタデータ) (2021-05-24T06:18:23Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。