論文の概要: PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution
3D Human Digitization
- arxiv url: http://arxiv.org/abs/2004.00452v1
- Date: Wed, 1 Apr 2020 13:52:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 19:21:36.994531
- Title: PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution
3D Human Digitization
- Title(参考訳): PIFuHD:高分解能3次元人体デジタル化のための多層カメラアライメントインシシシット機能
- Authors: Shunsuke Saito, Tomas Simon, Jason Saragih, Hanbyul Joo
- Abstract要約: 画像に基づく3次元人物形状推定の最近の進歩は、ディープニューラルネットワークによる表現力の大幅な向上によって引き起こされている。
正確な予測には大きなコンテキストを必要とするが、正確な予測には高解像度が必要である。
我々は、エンド・ツー・エンドのトレーニングが可能なマルチレベルアーキテクチャを定式化し、粗いレベルで画像全体を低解像度で観察し、全体論的推論に焦点を当てる。
提案手法は,1k分解能入力画像の完全活用により,既存の画像形状復元技術よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 38.6438956631446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in image-based 3D human shape estimation have been driven by
the significant improvement in representation power afforded by deep neural
networks. Although current approaches have demonstrated the potential in real
world settings, they still fail to produce reconstructions with the level of
detail often present in the input images. We argue that this limitation stems
primarily form two conflicting requirements; accurate predictions require large
context, but precise predictions require high resolution. Due to memory
limitations in current hardware, previous approaches tend to take low
resolution images as input to cover large spatial context, and produce less
precise (or low resolution) 3D estimates as a result. We address this
limitation by formulating a multi-level architecture that is end-to-end
trainable. A coarse level observes the whole image at lower resolution and
focuses on holistic reasoning. This provides context to an fine level which
estimates highly detailed geometry by observing higher-resolution images. We
demonstrate that our approach significantly outperforms existing
state-of-the-art techniques on single image human shape reconstruction by fully
leveraging 1k-resolution input images.
- Abstract(参考訳): 画像に基づく3次元人物形状推定の最近の進歩は、ディープニューラルネットワークによる表現力の大幅な向上によるものである。
現在のアプローチでは、実世界の設定においてその可能性を実証しているが、入力画像にしばしば現れる詳細レベルで再現することができない。
正確な予測には大きなコンテキストを必要とするが、正確な予測には高解像度が必要である。
現在のハードウェアにおけるメモリの制限のため、以前のアプローチでは、大きな空間的コンテキストをカバーするために低解像度のイメージを入力とし、結果として正確な(または低解像度の)3d推定を生成する傾向があった。
我々は、エンドツーエンドのトレーニング可能なマルチレベルアーキテクチャを定式化することで、この制限に対処する。
粗いレベルは、画像全体を低い解像度で観察し、全体論に焦点をあてる。
これにより、高解像度の画像を観察することで、高度に詳細な幾何学を推定できる。
提案手法は,1k分解能入力画像の完全活用により,既存の画像形状復元技術よりも優れていることを示す。
関連論文リスト
- SRGS: Super-Resolution 3D Gaussian Splatting [14.26021476067791]
本稿では,高分解能(HR)空間における最適化を実現するために,超解像3Dガウススティング(SRGS)を提案する。
サブピクセル制約はHR空間における視点の増大のために導入され、多重低解像度(LR)ビューのサブピクセル・クロスビュー情報を利用する。
MIP-NeRF 360 や Tanks & Temples のような挑戦的なデータセットにおいて,HRNVS のレンダリング品質は LR 入力のみで向上する。
論文 参考訳(メタデータ) (2024-04-16T06:58:30Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - Implicit Shape and Appearance Priors for Few-Shot Full Head
Reconstruction [17.254539604491303]
本稿では,数発のフル3次元頭部再構成の問題点に対処する。
我々は、座標に基づく表現に先立って確率的形状と外観を組み込むことにより、これを達成した。
我々はH3DSデータセットを拡張し、60個の高解像度3Dフルヘッドスキャンと対応する画像とマスクを含む。
論文 参考訳(メタデータ) (2023-10-12T07:35:30Z) - Refining 3D Human Texture Estimation from a Single Image [3.8761064607384195]
1枚の画像から3次元の人間のテクスチャを推定することは、グラフィックと視覚に不可欠である。
本稿では,オフセットが深層ニューラルネットワークを介して学習される変形可能な畳み込みによって,入力を適応的にサンプリングするフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T19:53:50Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z) - Super-resolution 3D Human Shape from a Single Low-Resolution Image [33.70299493354903]
単一の低解像度入力画像から超解像形状を再構成する新しい枠組みを提案する。
提案するフレームワークは,高精細な暗黙関数を持つ再構成形状を表す。
論文 参考訳(メタデータ) (2022-08-23T05:24:39Z) - H3D-Net: Few-Shot High-Fidelity 3D Head Reconstruction [27.66008315400462]
表面形状を暗黙的に表現する最近の学習手法は、多視点3次元再構成の問題において顕著な結果を示している。
我々はこれらの制限を,数発のフル3次元頭部再構成の特定の問題に対処する。
暗黙の表現を用いて,数千個の不完全な生スキャンから3次元頭部形状モデルを学習する。
論文 参考訳(メタデータ) (2021-07-26T23:04:18Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。