論文の概要: MVPainter: Accurate and Detailed 3D Texture Generation via Multi-View Diffusion with Geometric Control
- arxiv url: http://arxiv.org/abs/2505.12635v1
- Date: Mon, 19 May 2025 02:40:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.361888
- Title: MVPainter: Accurate and Detailed 3D Texture Generation via Multi-View Diffusion with Geometric Control
- Title(参考訳): MVPainter:幾何制御による多視点拡散による正確な3次元テクスチャ生成
- Authors: Mingqi Shao, Feng Xiong, Zhaoxu Sun, Mu Xu,
- Abstract要約: 基準テクスチャアライメント,幾何テクスチャ一貫性,局所テクスチャ品質の3次元レンズによる3次元テクスチャ生成について検討した。
本稿では,テクスチャの忠実度と詳細性を高めるために,データフィルタリングと拡張戦略を利用するMVPainterを提案する。
実世界のレンダリングアプリケーションに適したPBRメッシュを生成するために、生成したビューから物理ベースレンダリング(PBR)属性を抽出する。
- 参考スコア(独自算出の注目度): 1.8463601973573158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, significant advances have been made in 3D object generation. Building upon the generated geometry, current pipelines typically employ image diffusion models to generate multi-view RGB images, followed by UV texture reconstruction through texture baking. While 3D geometry generation has improved significantly, supported by multiple open-source frameworks, 3D texture generation remains underexplored. In this work, we systematically investigate 3D texture generation through the lens of three core dimensions: reference-texture alignment, geometry-texture consistency, and local texture quality. To tackle these issues, we propose MVPainter, which employs data filtering and augmentation strategies to enhance texture fidelity and detail, and introduces ControlNet-based geometric conditioning to improve texture-geometry alignment. Furthermore, we extract physically-based rendering (PBR) attributes from the generated views to produce PBR meshes suitable for real-world rendering applications. MVPainter achieves state-of-the-art results across all three dimensions, as demonstrated by human-aligned evaluations. To facilitate further research and reproducibility, we also release our full pipeline as an open-source system, including data construction, model architecture, and evaluation tools.
- Abstract(参考訳): 近年、3Dオブジェクト生成において重要な進歩がなされている。
生成した幾何学に基づいて、現在のパイプラインは通常、多視点RGB画像を生成するために画像拡散モデルを使用し、続いてテクスチャ焼成によるUVテクスチャ再構築を行う。
3Dテクスチャ生成は、複数のオープンソースフレームワークでサポートされているため、大幅に改善されているが、3Dテクスチャ生成はいまだに未調査である。
本研究では,3次元のレンズによる3次元テクスチャ生成について,基準テクスチャアライメント,幾何テクスチャ整合性,局所テクスチャ品質の3つを体系的に検討する。
これらの課題に対処するために,テクスチャの忠実度と詳細性を高めるためにデータフィルタリングと拡張戦略を採用したMVPainterを提案し,テクスチャ・幾何学的アライメントを改善するために,制御ネットに基づく幾何学的条件付けを導入した。
さらに、生成したビューから物理ベースレンダリング(PBR)属性を抽出し、実世界のレンダリングアプリケーションに適したPBRメッシュを生成する。
MVPainterは、人間によるアライメント評価によって示されるように、すべての3次元にわたる最先端の結果を達成する。
さらなる研究と再現性を促進するため、私たちは、データ構築、モデルアーキテクチャ、評価ツールを含むオープンソースのシステムとして、パイプライン全体をリリースしています。
関連論文リスト
- RomanTex: Decoupling 3D-aware Rotary Positional Embedded Multi-Attention Network for Texture Synthesis [10.350576861948952]
RomanTexはマルチビューベースのテクスチャ生成フレームワークで、マルチアテンションネットワークと基礎となる3D表現を統合している。
本手法はテクスチャの品質と整合性を実現する。
論文 参考訳(メタデータ) (2025-03-24T17:56:11Z) - Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation [56.862552362223425]
本稿では,多様な入力プロンプトから高品質な3次元形状とテクスチャを生成するための包括的枠組みを提案する。
フレームワークは3次元形状生成とテクスチャ生成で構成されている。
本報告では,フレームワークの改良と拡張に向けたシステムアーキテクチャ,実験結果,今後の方向性について述べる。
論文 参考訳(メタデータ) (2025-02-20T04:22:30Z) - GraphicsDreamer: Image to 3D Generation with Physical Consistency [32.26851174969898]
単一画像から高機能な3Dメッシュを作成する方法であるGraphicsDreamerを紹介する。
幾何融合の段階では、生成した3Dオブジェクトが信頼性の高いテクスチャの詳細を持つことを保証するため、PBRの制約を継続する。
提案手法はトポロジ最適化と高速なUVアンラッピング機能を備えており,3D画像をグラフィクスエンジンにシームレスにインポートすることができる。
論文 参考訳(メタデータ) (2024-12-18T10:01:27Z) - Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics [50.23625950905638]
6自由度(6-DOF)VR環境下での革新的な視線追跡実験により構築したテクスチャメッシュ・サリエンシのための新しいデータセットを提案する。
本モデルでは,各三角形の面を個々の単位として扱い,各局所表面領域の重要性を反映した塩分濃度値を割り当てることで,テクスチャメッシュ表面の塩分濃度マップを推定する。
論文 参考訳(メタデータ) (2024-12-11T08:27:33Z) - Direct and Explicit 3D Generation from a Single Image [25.207277983430608]
マルチビュー2次元深度画像とRGB画像を用いて表面形状とテクスチャを直接生成する新しいフレームワークを提案する。
画素レベルの多視点整合性を実現するために,エピポーラの注意を潜時から画素間デコーダに組み込む。
生成した深度画素を3次元空間にバックプロジェクションすることにより、構造化された3次元表現を生成する。
論文 参考訳(メタデータ) (2024-11-17T03:14:50Z) - DreamPolish: Domain Score Distillation With Progressive Geometry Generation [66.94803919328815]
本稿では,高精細な幾何学と高品質なテクスチャの創出に優れたテキスト・ツー・3D生成モデルであるDreamPolishを紹介する。
幾何構成フェーズでは, 合成過程の安定性を高めるために, 複数のニューラル表現を利用する。
テクスチャ生成フェーズでは、そのような領域に向けて神経表現を導くために、新しいスコア蒸留、すなわちドメインスコア蒸留(DSD)を導入する。
論文 参考訳(メタデータ) (2024-11-03T15:15:01Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。