論文の概要: OMGTex: One-stage Multi-style Facial Texture Reconstruction without Geometry Guidance
- arxiv url: http://arxiv.org/abs/2605.25778v1
- Date: Mon, 25 May 2026 12:26:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.034793
- Title: OMGTex: One-stage Multi-style Facial Texture Reconstruction without Geometry Guidance
- Title(参考訳): OMGTex:幾何誘導を伴わない一段階多面的顔面テクスチャ再構築
- Authors: Zitong Xiao, Yuda Qiu, Zisheng Ye, Xiaoguang Han,
- Abstract要約: OMGTexは、高品質で編集可能な顔紫外線テクスチャを再構築するためのエンドツーエンドの拡散ベースのフレームワークである。
私たちの中心となるイノベーションは、幾何学のないパイプラインで、2Dの顔画像をそれに対応する編集可能な紫外線テクスチャに直接マッピングします。
- 参考スコア(独自算出の注目度): 12.886725060369903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose OMGTex, an end-to-end diffusion-based framework for reconstructing high-quality and editable facial UV textures from multi-style facial images. Existing texture reconstruction methods face two major limitations: (1) Fragility due to reliance on 3D geometry priors, which are difficult to estimate accurately, especially under facial occlusions or in stylized domains; and (2) A lack of semantic disentanglement, inhibiting region-specific texture editing and style transfer. Our work addresses both challenges simultaneously. Our core innovation is a geometry-free pipeline that directly maps a 2D face image to its corresponding editable UV texture. We introduce two key techniques: First, to address the challenge of UV misalignment common in diffusion generation, we introduce a gradient-guided refinement strategy at inference time, which explicitly corrects structural consistency. Second, we leverage the inherent semantic distribution capability of diffusion models and design a novel training paradigm to enhance this tendency, enabling semantic-aware editing of facial texture. Furthermore, to address the data scarcity in multi-style texture reconstruction, we construct CANVAS, the first comprehensive paired texture reconstruction dataset covering realistic and diverse stylized domains. To the best of our knowledge, OMGTex is the first geometry-free inference framework that achieves robust, style-consistent, and editable facial texture reconstruction across diverse domains. Our method achieves state-of-the-art performance on multiple facial texture benchmarks.
- Abstract(参考訳): マルチスタイルの顔画像から高品質で編集可能な顔UVテクスチャを再構築するための,エンドツーエンドの拡散ベースフレームワークであるOMGTexを提案する。
既存のテクスチャ再構築手法では,(1)顔の隠蔽やスタイル化ドメインにおいて,特に正確な推定が難しい3次元幾何学的先行性に依存した脆弱さ,(2)意味的ゆがみの欠如,地域固有のテクスチャの編集やスタイル伝達の抑制,という2つの大きな限界に直面している。
私たちの仕事は両方の課題に同時に対処します。
私たちの中心となるイノベーションは、幾何学のないパイプラインで、2Dの顔画像をそれに対応する編集可能な紫外線テクスチャに直接マッピングします。
まず、拡散生成に共通する紫外線不整合の課題に対処するため、我々は、構造的整合性を明示的に補正する勾配誘導洗練された戦略を導入する。
第二に、拡散モデル固有の意味分布能力を活用し、新しい訓練パラダイムを設計し、この傾向を高め、顔のテクスチャのセマンティックアウェアな編集を可能にする。
さらに, マルチスタイルテクスチャ再構築におけるデータ不足に対処するため, CANVASを構築した。
我々の知る限りでは、OMGTexは、様々な領域にわたる堅牢で、スタイルに一貫性があり、編集可能な顔テクスチャ再構築を実現する最初の幾何学自由推論フレームワークである。
本手法は,複数の顔テクスチャベンチマークにおける最先端性能を実現する。
関連論文リスト
- Semantic-Guided Two-Stage GAN for Face Inpainting with Hybrid Perceptual Encoding [1.7761223012399532]
Facial Image inpaintingは、アイデンティティ、構造的一貫性、画質を保ちながら、顔画像の欠落した領域や破損した領域を復元することを目的としている。
既存の方法は大きな不規則なマスクで問題に直面し、しばしばマスクされた領域の端にぼやけたテクスチャを生み出す。
本稿では,これらの課題に対処する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-12-04T17:56:08Z) - AvatarTex: High-Fidelity Facial Texture Reconstruction from Single-Image Stylized Avatars [16.44346662761451]
AvatarTexは、顔のテクスチャを再構築するフレームワークで、単一の画像からスタイリングされたテクスチャとフォトリアリスティックなテクスチャの両方を生成することができる。
筆者らの3段階パイプラインは,まず拡散型塗り絵によるテクスチャ領域の欠如,GANによる潜時最適化によるスタイルと構造整合性の改善,拡散型塗り絵による細部細部の改善などを行った。
スタイル化されたテクスチャデータセットの必要性に対処するために,正確なUV整列レイアウトを備えた20,000のマルチスタイルUVテクスチャの高解像度コレクションであるTexHubを紹介した。
論文 参考訳(メタデータ) (2025-11-10T05:31:15Z) - SeqTex: Generate Mesh Textures in Video Sequence [62.766839821764144]
本稿では3次元テクスチャ生成モデルのトレーニングのための新しいエンドツーエンドフレームワークであるSeqTexを紹介する。
画像条件とテキスト条件の両テクスチャ生成タスクにおいて,SeqTexは最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-07-06T07:58:36Z) - RomanTex: Decoupling 3D-aware Rotary Positional Embedded Multi-Attention Network for Texture Synthesis [10.350576861948952]
RomanTexはマルチビューベースのテクスチャ生成フレームワークで、マルチアテンションネットワークと基礎となる3D表現を統合している。
本手法はテクスチャの品質と整合性を実現する。
論文 参考訳(メタデータ) (2025-03-24T17:56:11Z) - GausSurf: Geometry-Guided 3D Gaussian Splatting for Surface Reconstruction [79.42244344704154]
GausSurfは、テクスチャリッチな領域におけるマルチビュー一貫性と、シーンのテクスチャレスな領域における通常の事前の幾何学的ガイダンスを採用している。
本手法は,再現性や計算時間の観点から,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-11-29T03:54:54Z) - Text-Guided 3D Face Synthesis -- From Generation to Editing [53.86765812392627]
顔生成から編集までの統一的なテキスト誘導フレームワークを提案する。
我々は、RGBおよびYUV空間のテクスチャ品質を高めるために、微調整されたテクスチャ拡散モデルを用いている。
整合性を維持しつつ編集効率を向上させるための自己誘導整合性ウェイト戦略を提案する。
論文 参考訳(メタデータ) (2023-12-01T06:36:23Z) - Delicate Textured Mesh Recovery from NeRF via Adaptive Surface
Refinement [78.48648360358193]
画像からテクスチャ化された表面メッシュを生成する新しいフレームワークを提案する。
我々のアプローチは、NeRFを用いて幾何学とビュー依存の外観を効率的に初期化することから始まります。
ジオメトリと共同で外観を洗練し、テクスチャ画像に変換してリアルタイムレンダリングします。
論文 参考訳(メタデータ) (2023-03-03T17:14:44Z) - Self-supervised High-fidelity and Re-renderable 3D Facial Reconstruction
from a Single Image [19.0074836183624]
そこで本研究では,高品質な3次元顔の再構築を目的とした,新たな自己教師型学習フレームワークを提案する。
我々のフレームワークは質的比較と量的比較の両方において最先端のアプローチを大幅に上回っている。
論文 参考訳(メタデータ) (2021-11-16T08:10:24Z) - Unsupervised High-Fidelity Facial Texture Generation and Reconstruction [20.447635896077454]
本稿では,タスクとテクスチャの生成,高忠実度テクスチャの回復という新たな統合パイプラインを提案する。
テクスチャモデルでは,テクスチャマップのスキャンとは対照的に,自然画像から教師なしでテクスチャモデルを学習する。
正確な3DMMフィッティングを適用することで、モデル化したテクスチャを合成生成した背景画像にシームレスに統合することができる。
論文 参考訳(メタデータ) (2021-10-10T10:59:04Z) - Fast-GANFIT: Generative Adversarial Network for High Fidelity 3D Face
Reconstruction [76.1612334630256]
我々は、GAN(Generative Adversarial Networks)とDCNN(Deep Convolutional Neural Networks)の力を利用して、単一画像から顔のテクスチャと形状を再構築する。
3次元顔再構成を保存したフォトリアリスティックでアイデンティティに優れた結果を示し, 初めて, 高精度な顔テクスチャ再構成を実現する。
論文 参考訳(メタデータ) (2021-05-16T16:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。