Fugu-MT 論文翻訳(概要): Single-Image 3D Human Digitization with Shape-Guided Diffusion

論文の概要: Single-Image 3D Human Digitization with Shape-Guided Diffusion

arxiv url: http://arxiv.org/abs/2311.09221v1
Date: Wed, 15 Nov 2023 18:59:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-16 14:31:19.645279
Title: Single-Image 3D Human Digitization with Shape-Guided Diffusion
Title（参考訳）: 形状誘導拡散を用いた1画像3次元デジタル化
Authors: Badour AlBahar, Shunsuke Saito, Hung-Yu Tseng, Changil Kim, Johannes Kopf, Jia-Bin Huang
Abstract要約: NeRFとその変種は通常、異なる視点からのビデオや画像を必要とする。単一入力画像から一貫した高解像度の外観を持つ人物の360度映像を生成する手法を提案する。
参考スコア（独自算出の注目度）: 31.99621159464388
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present an approach to generate a 360-degree view of a person with a consistent, high-resolution appearance from a single input image. NeRF and its variants typically require videos or images from different viewpoints. Most existing approaches taking monocular input either rely on ground-truth 3D scans for supervision or lack 3D consistency. While recent 3D generative models show promise of 3D consistent human digitization, these approaches do not generalize well to diverse clothing appearances, and the results lack photorealism. Unlike existing work, we utilize high-capacity 2D diffusion models pretrained for general image synthesis tasks as an appearance prior of clothed humans. To achieve better 3D consistency while retaining the input identity, we progressively synthesize multiple views of the human in the input image by inpainting missing regions with shape-guided diffusion conditioned on silhouette and surface normal. We then fuse these synthesized multi-view images via inverse rendering to obtain a fully textured high-resolution 3D mesh of the given person. Experiments show that our approach outperforms prior methods and achieves photorealistic 360-degree synthesis of a wide range of clothed humans with complex textures from a single image.
Abstract（参考訳）: 単一入力画像から一貫した高解像度の外観を持つ人物の360度映像を生成する手法を提案する。 NeRFとその変種は通常、異なる視点からのビデオや画像を必要とする。モノクルインプットを取り入れる既存のアプローチは、監督のために地上の3Dスキャンに依存するか、3D一貫性が欠如している。近年の3次元生成モデルでは3次元一貫したデジタル化が期待できるが、これらの手法は多様な衣服の外観に適せず、フォトリアリズムが欠如している。既存の研究と異なり,一般画像合成タスクに事前訓練された高容量2次元拡散モデルを用いて,被衣人間に先行して出現する。入力アイデンティティを保ちつつ、より優れた3次元一貫性を実現するために、シルエットおよび表面正常に形状誘導拡散条件を付与した欠落領域を入力画像中の人間の複数のビューを段階的に合成する。次に、合成されたマルチビュー画像を逆レンダリングで融合し、その人物の完全なテクスチャ化された高解像度3dメッシュを得る。実験により,本手法は従来手法よりも優れており,単一の画像から複雑なテクスチャを持つ多種多様な衣服の360度合成を実現する。

関連論文リスト

FAMOUS: High-Fidelity Monocular 3D Human Digitization Using View Synthesis [51.193297565630886]
テクスチャを正確に推測することの難しさは、特に正面視画像の人物の背中のような不明瞭な領域に残る。このテクスチャ予測の制限は、大規模で多様な3Dデータセットの不足に起因する。本稿では,3次元デジタル化におけるテクスチャと形状予測の両立を図るために,広範囲な2次元ファッションデータセットを活用することを提案する。
論文参考訳（メタデータ） (2024-10-13T01:25:05Z)
Cafca: High-quality Novel View Synthesis of Expressive Faces from Casual Few-shot Captures [33.463245327698]
人間の顔に先立って,高忠実度表現型顔のモデリングが可能な新しい容積を提示する。我々は3D Morphable Face Modelを活用して大規模なトレーニングセットを合成し、それぞれのアイデンティティを異なる表現でレンダリングする。次に、この合成データセットに先立って条件付きニューラルレージアンスフィールドをトレーニングし、推論時に、モデルを1つの被験者の非常にスパースな実画像のセットで微調整する。
論文参考訳（メタデータ） (2024-10-01T12:24:50Z)
Single Image, Any Face: Generalisable 3D Face Generation [59.9369171926757]
我々は,制約のない単一画像入力を伴う3次元顔を生成する新しいモデルGen3D-Faceを提案する。私たちの知る限りでは、これは1枚の画像からフォトリアリスティックな3D顔アバターを作るための最初の試みであり、ベンチマークである。
論文参考訳（メタデータ） (2024-09-25T14:56:37Z)
En3D: An Enhanced Generative Model for Sculpting 3D Humans from 2D Synthetic Data [36.51674664590734]
本研究では,高品質な3次元アバターの小型化を図ったEn3Dを提案する。従来の3Dデータセットの不足や、視角が不均衡な限られた2Dコレクションと異なり、本研究の目的は、ゼロショットで3D人間を作れる3Dの開発である。
論文参考訳（メタデータ） (2024-01-02T12:06:31Z)
InceptionHuman: Controllable Prompt-to-NeRF for Photorealistic 3D Human Generation [61.62346472443454]
InceptionHumanは、異なるモードのプロンプトの組み合わせで簡単にコントロールでき、フォトリアリスティックな3D人間を生成することができるプロンプト・トゥ・NeRFフレームワークである。 InceptionHumanは、徐々に洗練されたNeRF空間内で、一貫した3Dヒューマン生成を実現する。
論文参考訳（メタデータ） (2023-11-27T15:49:41Z)
GETAvatar: Generative Textured Meshes for Animatable Human Avatars [69.56959932421057]
高品質なジオメトリとテクスチャを備えたアニマタブルな人体アバターを製作することを目的とした,3D対応フルボディヒューマンジェネレーションの課題について検討した。アニマタブルなヒトアバターの3Dレンダリングを直接生成する生成モデルであるGETAvatarを提案する。
論文参考訳（メタデータ） (2023-10-04T10:30:24Z)
DRaCoN -- Differentiable Rasterization Conditioned Neural Radiance Fields for Articulated Avatars [92.37436369781692]
フルボディの体積アバターを学習するためのフレームワークであるDRaCoNを提案する。 2Dと3Dのニューラルレンダリング技術の利点を利用する。挑戦的なZJU-MoCapとHuman3.6Mデータセットの実験は、DRaCoNが最先端の手法より優れていることを示している。
論文参考訳（メタデータ） (2022-03-29T17:59:15Z)
3D-Aware Semantic-Guided Generative Model for Human Synthesis [67.86621343494998]
本稿では,人間の画像合成のための3D-SGAN(Semantic-Guided Generative Model)を提案する。 DeepFashionデータセットに関する我々の実験は、3D-SGANが最新のベースラインを大きく上回っていることを示している。
論文参考訳（メタデータ） (2021-12-02T17:10:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。