論文の概要: Reposing Humans by Warping 3D Features
- arxiv url: http://arxiv.org/abs/2006.04898v1
- Date: Mon, 8 Jun 2020 19:31:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 02:09:43.427852
- Title: Reposing Humans by Warping 3D Features
- Title(参考訳): 人間の3次元特徴の温め方
- Authors: Markus Knoche, Istv\'an S\'ar\'andi, Bastian Leibe
- Abstract要約: 人間の画像から密集した特徴量について暗黙的に学習することを提案する。
ボリュームは畳み込みデコーダによってRGB空間にマッピングされる。
DeepFashionとiPERベンチマークの最先端結果は、密度の高い人間の表現が調査に値することを示している。
- 参考スコア(独自算出の注目度): 18.688568898013482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of reposing an image of a human into any desired novel
pose. This conditional image-generation task requires reasoning about the 3D
structure of the human, including self-occluded body parts. Most prior works
are either based on 2D representations or require fitting and manipulating an
explicit 3D body mesh. Based on the recent success in deep learning-based
volumetric representations, we propose to implicitly learn a dense feature
volume from human images, which lends itself to simple and intuitive
manipulation through explicit geometric warping. Once the latent feature volume
is warped according to the desired pose change, the volume is mapped back to
RGB space by a convolutional decoder. Our state-of-the-art results on the
DeepFashion and the iPER benchmarks indicate that dense volumetric human
representations are worth investigating in more detail.
- Abstract(参考訳): 我々は、人間のイメージを任意の望ましい新しいポーズに配置する問題に対処する。
この条件付き画像生成タスクは、自己閉鎖体部分を含む人間の3D構造を推論する必要がある。
ほとんどの先行作品は2d表現に基づいているか、明示的な3dボディメッシュを操作する必要がある。
近年の深層学習に基づくボリューム表現の成功を踏まえ,人間の画像から密集した特徴量を暗黙的に学習することを提案する。
所望のポーズ変化に応じて潜在機能ボリュームが反動されると、畳み込みデコーダによってボリュームはrgbスペースにマッピングされる。
DeepFashionとiPERベンチマークの最先端結果は、密度の高い人間の表現がより詳細に調べる価値があることを示している。
関連論文リスト
- SiTH: Single-view Textured Human Reconstruction with Image-Conditioned Diffusion [35.73448283467723]
SiTHは、イメージ条件付き拡散モデルと3Dメッシュ再構築ワークフローを統合する、新しいパイプラインである。
我々は、入力画像に基づいて、見えないバックビューの外観を幻覚させるために、強力な生成拡散モデルを用いる。
後者では,入力画像とバックビュー画像から全身のテクスチャメッシュを復元するためのガイダンスとして,肌付きボディーメッシュを利用する。
論文 参考訳(メタデータ) (2023-11-27T14:22:07Z) - Graphics Capsule: Learning Hierarchical 3D Face Representations from 2D
Images [82.5266467869448]
Inverse Graphics Capsule Network (IGC-Net) を提案する。
IGC-Netはまずオブジェクトをセマンティック一貫性のある部分レベルの記述の集合に分解し、それらをオブジェクトレベルの記述に組み立てて階層を構築する。
論文 参考訳(メタデータ) (2023-03-20T06:32:55Z) - Disentangling 3D Attributes from a Single 2D Image: Human Pose, Shape
and Garment [20.17991487155361]
本研究では,2次元画像データのみから不整合3次元属性を抽出する課題に焦点をあてる。
本手法は,これら3つの画像特性の非絡み合った潜在表現を用いた埋め込みを学習する。
本研究では, 暗黙的な形状の損失が, モデルが微細な復元の詳細を復元する上で, どのような効果があるかを示す。
論文 参考訳(メタデータ) (2022-08-05T13:48:43Z) - Single-view 3D Body and Cloth Reconstruction under Complex Poses [37.86174829271747]
既存の暗黙の関数ベースモデルを拡張して、任意のポーズと自己排他的な手足を持つ人間の画像を扱う。
入力画像を低精細度で3次元のボディ形状にマッピングする暗黙の関数を学習する。
次に、スムーズな表面を条件とした変位マップを学習し、衣服や身体の高周波の詳細を符号化する。
論文 参考訳(メタデータ) (2022-05-09T07:34:06Z) - 3D-Aware Semantic-Guided Generative Model for Human Synthesis [67.86621343494998]
本稿では,人間の画像合成のための3D-SGAN(Semantic-Guided Generative Model)を提案する。
DeepFashionデータセットに関する我々の実験は、3D-SGANが最新のベースラインを大きく上回っていることを示している。
論文 参考訳(メタデータ) (2021-12-02T17:10:53Z) - Detailed Avatar Recovery from Single Image [50.82102098057822]
本稿では,単一画像からエンフデテールアバターを回収するための新しい枠組みを提案する。
階層的メッシュ変形フレームワークでは、ディープニューラルネットワークを使用して3次元形状を洗練しています。
本手法は,皮膚モデルを超えて,完全なテクスチャで詳細な人体形状を復元することができる。
論文 参考訳(メタデータ) (2021-08-06T03:51:26Z) - RIN: Textured Human Model Recovery and Imitation with a Single Image [4.87676530016726]
本稿では,1枚の画像からテクスチャ化された3Dモデルを構築するための新しいボリュームベースフレームワークを提案する。
具体的には、人間のテクスチャのほとんどを推定するために、U-Netのようなフロントエンド翻訳ネットワークを提案する。
実験の結果,人間の模倣には容積モデルが適切であることが示され,バックビューはネットワークを用いて確実に推定できることがわかった。
論文 参考訳(メタデータ) (2020-11-24T11:04:35Z) - Pose2Mesh: Graph Convolutional Network for 3D Human Pose and Mesh
Recovery from a 2D Human Pose [70.23652933572647]
本稿では,人間のメッシュ頂点の3次元座標を直接推定するグラフ畳み込みニューラルネットワーク(GraphCNN)を提案する。
我々のPose2Meshは、様々なベンチマークデータセットにおいて、以前の3次元人間のポーズとメッシュ推定方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-20T16:01:56Z) - Unsupervised 3D Human Pose Representation with Viewpoint and Pose
Disentanglement [63.853412753242615]
優れた3次元ポーズ表現を学習することは、人間のポーズ関連タスクにとって重要である。
本稿では,3次元ポーズ表現を学習するために,新しいシームズ・デノナイズドオートエンコーダを提案する。
提案手法は,2つの本質的に異なるタスクに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-14T14:25:22Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。