論文の概要: ProtoRes: Proto-Residual Architecture for Deep Modeling of Human Pose
- arxiv url: http://arxiv.org/abs/2106.01981v1
- Date: Thu, 3 Jun 2021 16:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 16:20:01.334374
- Title: ProtoRes: Proto-Residual Architecture for Deep Modeling of Human Pose
- Title(参考訳): ProtoRes: 人間の視点の深部モデリングのためのプロトタイプアーキテクチャ
- Authors: Boris N. Oreshkin and Florent Bocquelet and F\'elix H. Harvey and Bay
Raitt and Dominic Laflamme
- Abstract要約: 我々はスパースと可変ユーザ入力に基づいて、フル静的な人間のポーズを構築する問題に取り組む。
本稿では,残余接続と部分的に指定されたポーズのプロトタイプエンコーディングを組み合わせて,新しい完全ポーズを生成するニューラルアーキテクチャを提案する。
リアルタイム3D開発プラットフォームであるUnityにニューラルネットワークを統合するためのユーザインターフェースを開発しました。
- 参考スコア(独自算出の注目度): 6.9997407868865364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our work focuses on the development of a learnable neural representation of
human pose for advanced AI assisted animation tooling. Specifically, we tackle
the problem of constructing a full static human pose based on sparse and
variable user inputs (e.g. locations and/or orientations of a subset of body
joints). To solve this problem, we propose a novel neural architecture that
combines residual connections with prototype encoding of a partially specified
pose to create a new complete pose from the learned latent space. We show that
our architecture outperforms a baseline based on Transformer, both in terms of
accuracy and computational efficiency. Additionally, we develop a user
interface to integrate our neural model in Unity, a real-time 3D development
platform. Furthermore, we introduce two new datasets representing the static
human pose modeling problem, based on high-quality human motion capture data,
which will be released publicly along with model code.
- Abstract(参考訳): 我々の研究は、高度なAI支援アニメーションツールのための人間のポーズの学習可能なニューラル表現の開発に焦点を当てている。
具体的には,スライスと可変ユーザ入力(例えば)に基づいて,完全な静的な人間のポーズを構築する問題に取り組む。
身体関節の部分集合の位置および/または方向)
この問題を解決するために,残余接続と部分的に指定されたポーズのプロトタイプエンコーディングを組み合わせ,学習された潜在空間から新しい完全ポーズを生成するニューラルアーキテクチャを提案する。
我々のアーキテクチャは,精度と計算効率の両面で,Transformerに基づくベースラインよりも優れていることを示す。
さらに、リアルタイム3D開発プラットフォームであるUnityにニューラルネットワークを統合するためのユーザインターフェースも開発しています。
さらに,静的なポーズモデル問題を表す2つの新しいデータセットを,高品質な人間のモーションキャプチャーデータに基づいて導入し,モデルコードとともに公開する。
関連論文リスト
- Robust Category-Level 3D Pose Estimation from Synthetic Data [17.247607850702558]
CADモデルから生成されたオブジェクトポーズ推定のための新しい合成データセットであるSyntheticP3Dを紹介する。
逆レンダリングによるポーズ推定を行うニューラルネットワークモデルをトレーニングするための新しいアプローチ(CC3D)を提案する。
論文 参考訳(メタデータ) (2023-05-25T14:56:03Z) - Decanus to Legatus: Synthetic training for 2D-3D human pose lifting [26.108023246654646]
10個の手作り3Dポーズ(Decanus)に基づく3Dポーズ分布から無限個の合成人間のポーズ(Legatus)を生成するアルゴリズムを提案する。
この結果から,特定データセットの実際のデータを用いた手法に匹敵する3次元ポーズ推定性能を,ゼロショット設定で実現し,フレームワークの可能性を示した。
論文 参考訳(メタデータ) (2022-10-05T13:10:19Z) - Neural Novel Actor: Learning a Generalized Animatable Neural
Representation for Human Actors [98.24047528960406]
本稿では,複数の人物の多視点画像のスパース集合から,汎用的アニマタブルなニューラル表現を学習するための新しい手法を提案する。
学習された表現は、カメラのスパースセットから任意の人の新しいビューイメージを合成し、さらにユーザのポーズ制御でアニメーション化することができる。
論文 参考訳(メタデータ) (2022-08-25T07:36:46Z) - Neural Rendering of Humans in Novel View and Pose from Monocular Video [68.37767099240236]
本稿では,新しい視点下で写真リアルな人間を生成し,モノクロ映像を入力として提示する新しい手法を提案する。
提案手法は,モノクラー映像を入力として,見知らぬポーズや新しい視点下での既存手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-04T03:09:20Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - 3D Human Pose Estimation with Spatial and Temporal Transformers [59.433208652418976]
PoseFormerは、3D人間のポーズ推定のための純粋にトランスフォーマーベースのアプローチです。
近年の視覚変換器の発展に触発されて,空間時間変換器構造を設計する。
提案手法を2つの人気ベンチマークと標準ベンチマークで定量的に定性的に評価する。
論文 参考訳(メタデータ) (2021-03-18T18:14:37Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。