論文の概要: RePose: Learning Deep Kinematic Priors for Fast Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2002.03933v1
- Date: Mon, 10 Feb 2020 16:44:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:08:31.613687
- Title: RePose: Learning Deep Kinematic Priors for Fast Human Pose Estimation
- Title(参考訳): repose: 人間の素早いポーズ推定のための深い運動前処理の学習
- Authors: Hossam Isack, Christian Haene, Cem Keskin, Sofien Bouaziz, Yuri
Boykov, Shahram Izadi and Sameh Khamis
- Abstract要約: 本稿では,1つの画像から人間のポーズ推定を行うための,効率的で軽量なモデルを提案する。
本モデルは,様々な最先端手法のパラメータ数と計算コストのごく一部で競合する結果を得るように設計されている。
- 参考スコア(独自算出の注目度): 17.0630180888369
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel efficient and lightweight model for human pose estimation
from a single image. Our model is designed to achieve competitive results at a
fraction of the number of parameters and computational cost of various
state-of-the-art methods. To this end, we explicitly incorporate part-based
structural and geometric priors in a hierarchical prediction framework. At the
coarsest resolution, and in a manner similar to classical part-based
approaches, we leverage the kinematic structure of the human body to propagate
convolutional feature updates between the keypoints or body parts. Unlike
classical approaches, we adopt end-to-end training to learn this geometric
prior through feature updates from data. We then propagate the feature
representation at the coarsest resolution up the hierarchy to refine the
predicted pose in a coarse-to-fine fashion. The final network effectively
models the geometric prior and intuition within a lightweight deep neural
network, yielding state-of-the-art results for a model of this size on two
standard datasets, Leeds Sports Pose and MPII Human Pose.
- Abstract(参考訳): 一つの画像から人間のポーズを推定する新しい効率的で軽量なモデルを提案する。
本モデルは,様々な最先端手法のパラメータ数と計算コストのごく一部で競合する結果を得るように設計されている。
この目的のために、階層的予測フレームワークに部分的構造と幾何学的事前を明示的に組み込む。
最も粗い解像度で、また古典的な部分ベースのアプローチと似た方法で、人体の運動構造を利用してキーポイントまたは身体部分間の畳み込み特徴の更新を伝達する。
従来のアプローチとは異なり、私たちはエンドツーエンドのトレーニングを採用して、データから機能更新を通じて幾何学的な事前学習を行っています。
次に、粗い解像度における特徴表現を階層化して、予測されたポーズを粗い方法で洗練する。
最終的なネットワークは、軽量なディープニューラルネットワーク内の幾何学的事前と直観を効果的にモデル化し、leeds sports poseとmpii human poseの2つの標準データセットで、このサイズのモデルに対して最先端の結果を与える。
関連論文リスト
- PGAHum: Prior-Guided Geometry and Appearance Learning for High-Fidelity Animatable Human Reconstruction [9.231326291897817]
我々はPGAHumを紹介した。PGAHumは、高忠実でアニマタブルな人体再構成のための、事前ガイダンス付き幾何学および外観学習フレームワークである。
我々はPGAHumの3つの主要モジュールにおける3次元人体前駆体を徹底的に利用し、複雑な細部と見えないポーズのフォトリアリスティックなビュー合成による高品質な幾何再構成を実現する。
論文 参考訳(メタデータ) (2024-04-22T04:22:30Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - GS-Pose: Category-Level Object Pose Estimation via Geometric and
Semantic Correspondence [5.500735640045456]
カテゴリーレベルのポーズ推定は、コンピュータビジョンやロボット工学における多くの潜在的な応用において難しい課題である。
本稿では,事前学習した基礎モデルから得られる幾何学的特徴と意味的特徴の両方を活用することを提案する。
これは、セマンティックな特徴がオブジェクトのテクスチャや外観に対して堅牢であるため、以前のメソッドよりもトレーニングするデータを大幅に少なくする。
論文 参考訳(メタデータ) (2023-11-23T02:35:38Z) - Scaling Pre-trained Language Models to Deeper via Parameter-efficient
Architecture [68.13678918660872]
行列積演算子(MPO)に基づくより有能なパラメータ共有アーキテクチャを設計する。
MPO分解はパラメータ行列の情報を再編成し、2つの部分に分解することができる。
私たちのアーキテクチャは、モデルのサイズを減らすために、すべてのレイヤで中央テンソルを共有しています。
論文 参考訳(メタデータ) (2023-03-27T02:34:09Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Bridge the Gap Between Model-based and Model-free Human Reconstruction [10.818838437018682]
グラフ畳み込みニューラルネットワークによって構築された暗黙の面と明示的なメッシュモデルを同時に予測するエンド・ツー・エンドニューラルネットワークを提案する。
DeepHumanデータセットの実験は、我々のアプローチが効果的であることを示した。
論文 参考訳(メタデータ) (2021-06-11T11:13:42Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z) - Monocular Human Pose and Shape Reconstruction using Part Differentiable
Rendering [53.16864661460889]
近年の研究では、3次元基底真理によって教師されるディープニューラルネットワークを介してパラメトリックモデルを直接推定する回帰に基づく手法が成功している。
本稿では,ボディセグメンテーションを重要な監視対象として紹介する。
部分分割による再構成を改善するために,部分分割により部分ベースモデルを制御可能な部分レベル微分可能部を提案する。
論文 参考訳(メタデータ) (2020-03-24T14:25:46Z) - Hierarchical Kinematic Human Mesh Recovery [30.348060841242628]
一つの画像から3次元メッシュのパラメトリックモデルを推定する問題を考察する。
本稿では,ヒトのパラメトリックモデルの回帰に関する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T16:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。