論文の概要: Unsupervised Human Pose Estimation through Transforming Shape Templates
- arxiv url: http://arxiv.org/abs/2105.04154v1
- Date: Mon, 10 May 2021 07:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 15:20:37.354627
- Title: Unsupervised Human Pose Estimation through Transforming Shape Templates
- Title(参考訳): 変形形状テンプレートを用いた教師なしポーズ推定
- Authors: Luca Schmidtke, Athanasios Vlontzos, Simon Ellershaw, Anna Lukens,
Tomoki Arichi, Bernhard Kainz
- Abstract要約: 本研究では,成人および乳幼児のポーズ推定を教師なしで学習するための新しい手法を提案する。
成人と幼児を含む2つの異なるデータセットに対するアプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 2.729524133721473
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation is a major computer vision problem with applications
ranging from augmented reality and video capture to surveillance and movement
tracking. In the medical context, the latter may be an important biomarker for
neurological impairments in infants. Whilst many methods exist, their
application has been limited by the need for well annotated large datasets and
the inability to generalize to humans of different shapes and body
compositions, e.g. children and infants. In this paper we present a novel
method for learning pose estimators for human adults and infants in an
unsupervised fashion. We approach this as a learnable template matching problem
facilitated by deep feature extractors. Human-interpretable landmarks are
estimated by transforming a template consisting of predefined body parts that
are characterized by 2D Gaussian distributions. Enforcing a connectivity prior
guides our model to meaningful human shape representations. We demonstrate the
effectiveness of our approach on two different datasets including adults and
infants.
- Abstract(参考訳): 人間のポーズ推定は、拡張現実やビデオキャプチャーから監視や動き追跡まで幅広い応用において主要なコンピュータビジョン問題である。
医学的文脈では、後者は幼児の神経障害にとって重要なバイオマーカーである。
多くの方法が存在するが、それらの応用は、よく注釈された大きなデータセットの必要性や、異なる形状や体組成を持つ人間に一般化できないことなどによって制限されている。
子供と幼児。
本稿では,成人および乳幼児のポーズ推定を教師なしで学習するための新しい手法を提案する。
深層特徴抽出器による学習可能なテンプレートマッチング問題としてこの問題にアプローチする。
2次元ガウス分布を特徴とする予め定義された身体部分からなるテンプレートを変換して、人間の解釈可能なランドマークを推定する。
接続先を強制することは、モデルを有意義な人間の形状表現に導く。
成人と幼児を含む2つの異なるデータセットに対するアプローチの有効性を示す。
関連論文リスト
- Closely Interactive Human Reconstruction with Proxemics and Physics-Guided Adaption [64.07607726562841]
既存の人間再建アプローチは主に、正確なポーズの回復や侵入を避けることに焦点を当てている。
本研究では,モノクロ映像から密に対話的な人間を再構築する作業に取り組む。
本稿では,視覚情報の欠如を補うために,確率的行動や物理からの知識を活用することを提案する。
論文 参考訳(メタデータ) (2024-04-17T11:55:45Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Challenges in Video-Based Infant Action Recognition: A Critical
Examination of the State of the Art [9.327466428403916]
InfActPrimitive’という,5つの重要な幼児マイルストーンアクションカテゴリを含む,画期的なデータセットを紹介します。
近縁骨格に基づく行動認識モデルを用いた広範囲な比較分析を行う。
以上の結果から,PoseC3Dモデルでは約71%の精度で高い精度を達成できたが,残りのモデルでは乳幼児行動の動態を正確に把握することが困難であった。
論文 参考訳(メタデータ) (2023-11-21T02:36:47Z) - Efficient Domain Adaptation via Generative Prior for 3D Infant Pose
Estimation [29.037799937729687]
3Dの人間のポーズ推定は近年目覚ましい発展を遂げていますが、骨の長さが異なり、データも限られている幼児に焦点を当てた研究はごくわずかです。
本稿では,SyRIPデータセットで43.6mm,MINI-RGBDデータセットで21.2mmのMPJPE性能が得られることを示す。
また,本手法のZeDO-iは,少数のデータしか与えられなくても,効率的なドメイン適応が可能であることを証明した。
論文 参考訳(メタデータ) (2023-11-17T20:49:37Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Invariant Representation Learning for Infant Pose Estimation with Small
Data [14.91506452479778]
合成乳児ポーズと合成乳幼児ポーズとを併用したハイブリッド合成乳幼児ポーズデータセットを作成した。
我々は,SyRIPデータセットでトレーニングしたモデルと同一ネットワーク構造を用いたアブレーション調査を行い,他の公立幼児ポーズデータセットでトレーニングしたモデルよりも顕著に改善したことを示した。
最新のDarkPoseモデルを用いた幼児のポーズ推定では、平均的精度(mAP)は93.6である。
論文 参考訳(メタデータ) (2020-10-13T01:10:14Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - AMIL: Adversarial Multi Instance Learning for Human Pose Estimation [24.175298058941515]
本稿では,ネットワークのトレーニングにおいて,事前を慎重に考慮する構造対応ネットワークを提案する。
我々は2つの残留多重インスタンス学習モデル(MIL)を設計する学習モデルとして、生成逆ネットワークを提案する。
プールをベースとした逆数残差マルチインスタンスニューラルネットワークを2つのデータセットで検証した。
論文 参考訳(メタデータ) (2020-03-18T01:22:16Z) - Deformation-aware Unpaired Image Translation for Pose Estimation on
Laboratory Animals [56.65062746564091]
我々は,神経回路が行動をどのようにオーケストレーションするかを研究するために,手動による監督を使わずに,神経科学モデル生物のポーズを捉えることを目的としている。
我々の重要な貢献は、未完成の画像翻訳フレームワークにおける外観、形状、ポーズの明示的で独立したモデリングである。
ショウジョウバエ(ハエ)、線虫(線虫)、ダニオ・レリオ(ゼブラフィッシュ)のポーズ推定精度の向上を実証した。
論文 参考訳(メタデータ) (2020-01-23T15:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。