論文の概要: Recognition of Freely Selected Keypoints on Human Limbs
- arxiv url: http://arxiv.org/abs/2204.06326v1
- Date: Wed, 13 Apr 2022 11:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 13:21:10.265211
- Title: Recognition of Freely Selected Keypoints on Human Limbs
- Title(参考訳): 自由選択されたヒト四肢キーポイントの認識
- Authors: Katja Ludwig, Daniel Kienzle, Rainer Lienhart
- Abstract要約: 我々はVision Transformerアーキテクチャを用いて、モデルの能力を拡張し、人の手足の任意のキーポイントを検出する。
提案手法は固定キーポイント上のTokenPoseと類似し,手足上の任意のキーポイントを検出することができる。
- 参考スコア(独自算出の注目度): 18.176606453818557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nearly all Human Pose Estimation (HPE) datasets consist of a fixed set of
keypoints. Standard HPE models trained on such datasets can only detect these
keypoints. If more points are desired, they have to be manually annotated and
the model needs to be retrained. Our approach leverages the Vision Transformer
architecture to extend the capability of the model to detect arbitrary
keypoints on the limbs of persons. We propose two different approaches to
encode the desired keypoints. (1) Each keypoint is defined by its position
along the line between the two enclosing keypoints from the fixed set and its
relative distance between this line and the edge of the limb. (2) Keypoints are
defined as coordinates on a norm pose. Both approaches are based on the
TokenPose architecture, while the keypoint tokens that correspond to the fixed
keypoints are replaced with our novel module. Experiments show that our
approaches achieve similar results to TokenPose on the fixed keypoints and are
capable of detecting arbitrary keypoints on the limbs.
- Abstract(参考訳): ほぼすべてのヒューマンポーズ推定(hpe)データセットは、固定されたキーポイントからなる。
このようなデータセットでトレーニングされた標準hpeモデルは、これらのキーポイントのみを検出することができる。
より多くのポイントが必要な場合、手動でアノテートし、モデルを再トレーニングする必要があります。
我々のアプローチでは、Vision Transformerアーキテクチャを利用して、モデルの能力を拡張し、人の手足の任意のキーポイントを検出する。
所望のキーポイントをエンコードする2つの異なる手法を提案する。
1) 各キーポイントは、固定されたセットから2つの閉じたキーポイントの間の線の位置と、この線と四肢の縁の間の相対距離によって定義される。
2)キーポイントはノルムポーズ上の座標として定義される。
どちらのアプローチもTokenPoseアーキテクチャに基づいており、固定キーポイントに対応するキーポイントトークンは新たなモジュールに置き換えられています。
実験の結果,固定キーポイントのTokenPoseと同じような結果が得られ,手足の任意のキーポイントを検出できることがわかった。
関連論文リスト
- GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring [9.322937309882022]
キーポイントには、品質に応じてスコアをランク付けできるスコアが付属する。
学習されたキーポイントは手作りのものよりも優れた特性を示すことが多いが、それらのスコアは容易に解釈できない。
本稿では,どの手法でも抽出したキーポイントを解釈可能なスコアで特徴付けることができるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-30T09:39:59Z) - Meta-Point Learning and Refining for Category-Agnostic Pose Estimation [46.98479393474727]
Category-Agnostic pose Estimation (CAPE) は、キーポイントを付加したいくつかのサポートイメージが与えられた場合、任意のクラスのキーポイントを予測することを目的としている。
このような潜在的なキーポイント(メタポイント)に基づくCAPEのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-20T14:54:33Z) - DeDoDe: Detect, Don't Describe -- Describe, Don't Detect for Local
Feature Matching [14.837075102089]
キーポイント検出は3次元再構成において重要なステップであり、シーンの各ビューで最大K点のセットを検出する。
従来の学習に基づく手法は、通常、キーポイントを持つ記述子を学習し、キーポイント検出を隣り合う隣人の二項分類タスクとして扱う。
本研究は, キーポイントを3次元整合性から直接学習し, この目的を達成するための半教師付き2視点検出目標を導出する。
その結果,複数の幾何ベンチマークにおいて,DeDoDeという手法が大幅に向上していることが判明した。
論文 参考訳(メタデータ) (2023-08-16T16:37:02Z) - Pose for Everything: Towards Category-Agnostic Pose Estimation [93.07415325374761]
Category-Agnostic Pose Estimation (CAPE) は、キーポイント定義を持つ少数のサンプルのみを与えられた任意の種類のオブジェクトのポーズを検出することができるポーズ推定モデルを作成することを目的としている。
異なるキーポイント間のインタラクションと、サポートとクエリイメージの関係をキャプチャするために、トランスフォーマーベースのキーポイントインタラクションモジュール(KIM)を提案する。
また、20K以上のインスタンスを含む100のオブジェクトカテゴリの2次元ポーズデータセットであるMP-100データセットを導入し、CAPEアルゴリズムの開発に適している。
論文 参考訳(メタデータ) (2022-07-21T09:40:54Z) - End-to-End Learning of Keypoint Representations for Continuous Control
from Images [84.8536730437934]
教師なしの事前学習、デコーダ、追加の損失を必要とせずに、エンドツーエンドで効率的なキーポイント表現を学習できることが示される。
提案アーキテクチャは,ソフトアクター・クリティカルエージェントに直接座標を供給するキーポイント抽出器で構成されている。
論文 参考訳(メタデータ) (2021-06-15T09:17:06Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - UKPGAN: A General Self-Supervised Keypoint Detector [43.35270822722044]
UKPGANは一般的な3Dキーポイント検出器である。
私たちのキーポイントは、注釈付きキーポイントラベルとよく一致します。
我々のモデルは、剛性と非剛性変換の両方の下で安定である。
論文 参考訳(メタデータ) (2020-11-24T09:08:21Z) - Keypoint Autoencoders: Learning Interest Points of Semantics [4.551313396927381]
キーポイント検出のための教師なし学習手法であるキーポイントオートエンコーダを提案する。
キーポイントから元のポイントクラウドへの再構成を強制することで、疎いセマンティックキーポイントの選択を奨励する。
選択したキーポイントの特異性を示すために、スパースキーポイントで形状を分類する下流タスクを行う。
論文 参考訳(メタデータ) (2020-08-11T03:43:18Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。