論文の概要: Hitem3D 2.0: Multi-View Guided Native 3D Texture Generation
- arxiv url: http://arxiv.org/abs/2604.09231v1
- Date: Fri, 10 Apr 2026 11:40:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.838505
- Title: Hitem3D 2.0: Multi-View Guided Native 3D Texture Generation
- Title(参考訳): Hitem3D 2.0: マルチビューガイドによるネイティブ3Dテクスチャ生成
- Authors: Huiang He, Shengchu Zhao, Jianwen Huang, Jie Li, Jiaqi Wu, Hu Zhang, Pei Tang, Heliang Zheng, Yukun Li, Rongfei Jia,
- Abstract要約: Hitem3D 2.0は、マルチビューガイド付きネイティブな3Dテクスチャ生成フレームワークである。
2次元のマルチビュー生成とネイティブな3次元テクスチャ表現を統合することで、テクスチャ品質を向上させる。
実験の結果,Hitem3D 2.0はテクスチャの細部,忠実度,一貫性,コヒーレンス,アライメントの点で既存手法よりも優れていた。
- 参考スコア(独自算出の注目度): 19.416162774595865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although recent advances have improved the quality of 3D texture generation, existing methods still struggle with incomplete texture coverage, cross-view inconsistency, and misalignment between geometry and texture. To address these limitations, we propose Hitem3D 2.0, a multi-view guided native 3D texture generation framework that enhances texture quality through the integration of 2D multi-view generation priors and native 3D texture representations. Hitem3D 2.0 comprises two key components: a multi-view synthesis framework and a native 3D texture generation model. The multi-view generation is built upon a pre-trained image editing backbone and incorporates plug-and-play modules that explicitly promote geometric alignment, cross-view consistency, and illumination uniformity, thereby enabling the synthesis of high-fidelity multi-view images. Conditioned on the generated views and 3D geometry, the native 3D texture generation model projects multi-view textures onto 3D surfaces while plausibly completing textures in unseen regions. Through the integration of multi-view consistency constraints with native 3D texture modeling, Hitem3D 2.0 significantly improves texture completeness, cross-view coherence, and geometric alignment. Experimental results demonstrate that Hitem3D 2.0 outperforms existing methods in terms of texture detail, fidelity, consistency, coherence, and alignment.
- Abstract(参考訳): 近年, 3次元テクスチャ生成の質が向上しているが, 既存の手法では, 不完全なテクスチャカバレッジ, クロスビューの不整合, テクスチャとテクスチャの相違に苦慮している。
このような制約に対処するため,Hytem3D 2.0を提案する。Hytem3D 2.0は,2次元のマルチビュー生成先行とネイティブな3次元テクスチャ表現を統合することで,テクスチャ品質を向上する,マルチビューガイド付きネイティブ3Dテクスチャ生成フレームワークである。
Hitem3D 2.0は、マルチビュー合成フレームワークとネイティブな3Dテクスチャ生成モデルという、2つの重要なコンポーネントから構成されている。
マルチビュー生成は、予めトレーニングされた画像編集バックボーン上に構築され、幾何学的アライメント、クロスビュー一貫性、照明均一性を明示的に促進するプラグイン・アンド・プレイモジュールを組み込むことにより、高忠実なマルチビュー画像の合成を可能にする。
生成したビューと3D幾何に基づいて、ネイティブな3Dテクスチャ生成モデルは、3D表面にマルチビューテクスチャを投影する。
ネイティブな3Dテクスチャモデリングとマルチビュー一貫性の制約を統合することで、Hitem3D 2.0はテクスチャ完全性、クロスビューコヒーレンス、幾何学的アライメントを大幅に改善する。
実験の結果,Hitem3D 2.0はテクスチャの細部,忠実度,一貫性,コヒーレンス,アライメントの点で既存手法よりも優れていた。
関連論文リスト
- Advancing high-fidelity 3D and Texture Generation with 2.5D latents [21.33523572280285]
本稿では3次元幾何学とテクスチャの融合生成のための新しい枠組みを提案する。
具体的には、2Dと3Dの間でシームレスに変換できる汎用2.5D表現を生成することに重点を置いている。
我々のモデルは、テキストや画像からのコヒーレントな構造と色を持つ高品質な3Dオブジェクトの生成に優れるだけでなく、テクスチャ生成における既存の手法よりも優れています。
論文 参考訳(メタデータ) (2025-05-27T11:35:35Z) - RomanTex: Decoupling 3D-aware Rotary Positional Embedded Multi-Attention Network for Texture Synthesis [10.350576861948952]
RomanTexはマルチビューベースのテクスチャ生成フレームワークで、マルチアテンションネットワークと基礎となる3D表現を統合している。
本手法はテクスチャの品質と整合性を実現する。
論文 参考訳(メタデータ) (2025-03-24T17:56:11Z) - Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation [56.862552362223425]
本稿では,多様な入力プロンプトから高品質な3次元形状とテクスチャを生成するための包括的枠組みを提案する。
フレームワークは3次元形状生成とテクスチャ生成で構成されている。
本報告では,フレームワークの改良と拡張に向けたシステムアーキテクチャ,実験結果,今後の方向性について述べる。
論文 参考訳(メタデータ) (2025-02-20T04:22:30Z) - InsTex: Indoor Scenes Stylized Texture Synthesis [81.12010726769768]
拡張現実(ARVR)アプリケーションでは、高品質なテクスチャが3Dシーンに不可欠である。
現在の手法は、長い処理時間と視覚的アーティファクトに悩まされている。
3Dシーンのための高品質なテクスチャを生成するために設計された2段階アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-01-22T08:37:59Z) - Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models [112.2625368640425]
High- resolution Image-to-3D model (Hi3D) はビデオ拡散に基づく新しいパラダイムであり、単一の画像を3D対応シーケンシャル画像生成としてマルチビュー画像に再定義する。
Hi3Dは事前に学習した映像拡散モデルを3D対応で強化し、低解像度のテクスチャディテールを持つマルチビュー画像を生成する。
論文 参考訳(メタデータ) (2024-09-11T17:58:57Z) - Meta 3D TextureGen: Fast and Consistent Texture Generation for 3D Objects [54.80813150893719]
高品質なテクスチャを20秒未満で生成することを目的とした,2つのシーケンシャルネットワークで構成される新しいフィードフォワード方式であるMeta 3D TextureGenを紹介する。
提案手法は,2次元空間の3次元セマンティクスにテキスト・ツー・イメージ・モデルを適用し,それらを完全かつ高解像度なUVテクスチャマップに融合することにより,品質とスピードを向上する。
さらに、任意の比率で任意のテクスチャをアップスケーリングできるテクスチャ拡張ネットワークを導入し、4kピクセルの解像度テクスチャを生成します。
論文 参考訳(メタデータ) (2024-07-02T17:04:34Z) - GET3D: A Generative Model of High Quality 3D Textured Shapes Learned
from Images [72.15855070133425]
本稿では,複雑なトポロジ,リッチな幾何学的ディテール,高忠実度テクスチャを備えたExplicit Textured 3Dメッシュを直接生成する生成モデルであるGET3Dを紹介する。
GET3Dは、車、椅子、動物、バイク、人間キャラクターから建物まで、高品質な3Dテクスチャメッシュを生成することができる。
論文 参考訳(メタデータ) (2022-09-22T17:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。