Fugu-MT 論文翻訳(概要): Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

論文の概要: Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation

arxiv url: http://arxiv.org/abs/2501.12202v2
Date: Wed, 22 Jan 2025 12:01:39 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-23 14:42:23.519892
Title: Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation
Title（参考訳）: Hunyuan3D 2.0:高分解能テクスチャ3次元アセット生成のための拡散モデルのスケーリング
Authors: Zibo Zhao, Zeqiang Lai, Qingxiang Lin, Yunfei Zhao, Haolin Liu, Shuhui Yang, Yifei Feng, Mingxin Yang, Sheng Zhang, Xianghui Yang, Huiwen Shi, Sicong Liu, Junta Wu, Yihang Lian, Fan Yang, Ruining Tang, Zebin He, Xinzhou Wang, Jian Liu, Xuhui Zuo, Zhuo Chen, Biwen Lei, Haohan Weng, Jing Xu, Yiling Zhu, Xinhai Liu, Lixin Xu, Changrong Hu, Tianyu Huang, Lifu Wang, Jihong Zhang, Meng Chen, Liang Dong, Yiwen Jia, Yulin Cai, Jiaao Yu, Yixuan Tang, Hao Zhang, Zheng Ye, Peng He, Runzhou Wu, Chao Zhang, Yonghao Tan, Jie Xiao, Yangyu Tao, Jianchen Zhu, Jinbao Xue, Kai Liu, Chongqing Zhao, Xinming Wu, Zhichao Hu, Lei Qin, Jianbing Peng, Zhan Li, Minghui Chen, Xipeng Zhang, Lin Niu, Paige Wang, Yingkai Wang, Haozhao Kuang, Zhongyi Fan, Xu Zheng, Weihao Zhuang, YingPing He, Tian Liu, Yong Yang, Di Wang, Yuhong Liu, Jie Jiang, Jingwei Huang, Chunchao Guo,
Abstract要約: Hunyuan3D 2.0は、高分解能なテクスチャ3Dアセットを生成するための大規模3D合成システムである。スケーラブルなフローベース拡散変圧器上に構築された形状生成モデルは、所定の条件画像と適切に整合する幾何を作成することを目的としている。テクスチャ合成モデルは、強い幾何学的および拡散前の利点を生かし、高解像度で活気のあるテクスチャマップを生成する。
参考スコア（独自算出の注目度）: 42.50869050898905
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present Hunyuan3D 2.0, an advanced large-scale 3D synthesis system for generating high-resolution textured 3D assets. This system includes two foundation components: a large-scale shape generation model -- Hunyuan3D-DiT, and a large-scale texture synthesis model -- Hunyuan3D-Paint. The shape generative model, built on a scalable flow-based diffusion transformer, aims to create geometry that properly aligns with a given condition image, laying a solid foundation for downstream applications. The texture synthesis model, benefiting from strong geometric and diffusion priors, produces high-resolution and vibrant texture maps for either generated or hand-crafted meshes. Furthermore, we build Hunyuan3D-Studio -- a versatile, user-friendly production platform that simplifies the re-creation process of 3D assets. It allows both professional and amateur users to manipulate or even animate their meshes efficiently. We systematically evaluate our models, showing that Hunyuan3D 2.0 outperforms previous state-of-the-art models, including the open-source models and closed-source models in geometry details, condition alignment, texture quality, and etc. Hunyuan3D 2.0 is publicly released in order to fill the gaps in the open-source 3D community for large-scale foundation generative models. The code and pre-trained weights of our models are available at: https://github.com/Tencent/Hunyuan3D-2
Abstract（参考訳）: Hunyuan3D 2.0は高分解能なテクスチャ3Dアセットを生成するための大規模3D合成システムである。このシステムには、大規模な形状生成モデルであるHunyuan3D-DiTと、大規模なテクスチャ合成モデルであるHunyuan3D-Paintの2つの基礎コンポーネントが含まれている。スケーラブルなフローベース拡散変換器上に構築された形状生成モデルは、所定の条件画像と適切に整合する幾何を作成することを目的としており、下流アプリケーションのための確かな基盤を築き上げている。テクスチャ合成モデルは、強い幾何学的および拡散前の利点を生かし、生成または手作りのメッシュに対して高解像度で活気あるテクスチャマップを生成する。 Hunyuan3D-Studioは汎用的でユーザフレンドリーなプロダクションプラットフォームで、3Dアセットの再作成プロセスをシンプルにします。プロとアマチュアの両方のユーザが、メッシュを効率的に操作したり、アニメーションしたりできる。我々は,Hunyuan3D 2.0が,オープンソースモデルやクローズドソースモデルなど,従来の最先端モデルよりも,幾何学的詳細,条件整合性,テクスチャ品質などにおいて優れていたことを,体系的に評価した。 Hunyuan3D 2.0は、大規模な基礎生成モデルのためのオープンソースの3Dコミュニティのギャップを埋めるために、公開された。私たちのモデルのコードと事前トレーニングされた重み付けは、https://github.com/Tencent/Hunyuan3D-2. で利用可能です。

関連論文リスト

Hunyuan3D 2.5: Towards High-Fidelity 3D Assets Generation with Ultimate Details [23.393893197088843]
Hunyuan3D 2.5は、高忠実で詳細なテクスチャ化された3Dアセットを生成することを目的とした、3D拡散モデルの堅牢なスイートである。形状生成に関して、我々は、スケールした高品質なデータセット、モデルサイズ、計算で訓練された新しい形状基礎モデルLATTICEを導入する。テクスチャ生成に関しては、Hunyuan3D 2.0 Paintモデルから拡張された新しいマルチビューアーキテクチャにより、PBR(phyiscal-based rendering)によってアップグレードされる。
論文参考訳（メタデータ） (2025-06-19T17:57:40Z)
Hunyuan3D 2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material [36.1986525609658]
Hunyuan3D 2.1は高解像度でテクスチャ化された3Dアセットを製造するための先進的なシステムである。このチュートリアルでは、3Dデータの処理、3D生成モデルのトレーニング、パフォーマンス評価に関するステップバイステップガイドを提供する。
論文参考訳（メタデータ） (2025-06-18T13:14:46Z)
Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation [15.374873279207623]
本稿では,3Dオブジェクトの生成,編集,拡張を行う効率的なフレームワークであるKiss3DGen(Keep It Simple and Straightforward in 3D Generation)を紹介する。具体的には,多視点画像とその対応する正規写像からなるタイル付き表現である'3D Bundle Image'を生成するために拡散モデルを微調整する。この簡単な方法は、3次元生成問題を2次元画像生成タスクに効果的に変換し、事前訓練された拡散モデルにおける知識の利用を最大化する。
論文参考訳（メタデータ） (2025-03-03T10:07:19Z)
Structured 3D Latents for Scalable and Versatile 3D Generation [28.672494137267837]
汎用的で高品質な3Dアセット作成のための新しい3D生成手法を提案する。基本となるのは、異なる出力フォーマットへのデコードを可能にする、構造化されたLATent表現である。これは、疎人口の少ない3Dグリッドと、強力な視覚基盤モデルから抽出された濃密な多視点視覚特徴を統合することで実現される。
論文参考訳（メタデータ） (2024-12-02T13:58:38Z)
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion [86.25111098482537]
3DTopia-XLは,既存の手法の限界を克服するために設計された,スケーラブルなネイティブな3D生成モデルである。 3DTopia-XLは、新しいプリミティブベースの3D表現であるPrimXを利用して、詳細な形状、アルベド、マテリアルフィールドをコンパクトなテンソル形式にエンコードする。その上で, 1) 原始的パッチ圧縮, 2) および潜在的原始的拡散を含む拡散変換器(DiT)に基づく生成フレームワークを提案する。我々は,3DTopia-XLが既存の手法よりも高い性能を示すことを示すために,広範囲な定性的,定量的な実験を行った。
論文参考訳（メタデータ） (2024-09-19T17:59:06Z)
DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data [50.164670363633704]
テキストプロンプトから高品質な3Dアセットを作成するための拡散型3D生成モデルであるDIRECT-3Dを提案する。我々のモデルは、広範に騒々しく不整合な3D資産で直接訓練されている。単一クラス生成とテキスト・ツー・3D生成の両方で最先端の性能を実現する。
論文参考訳（メタデータ） (2024-06-06T17:58:15Z)
Breathing New Life into 3D Assets with Generative Repainting [74.80184575267106]
拡散ベースのテキスト・ツー・イメージ・モデルは、ビジョン・コミュニティ、アーティスト、コンテンツ・クリエーターから大きな注目を集めた。近年の研究では、拡散モデルとニューラルネットワークの絡み合いを利用した様々なパイプラインが提案されている。予備訓練された2次元拡散モデルと標準3次元ニューラルラジアンスフィールドのパワーを独立したスタンドアロンツールとして検討する。我々のパイプラインはテクスチャ化されたメッシュや無テクスチャのメッシュのような、レガシなレンダリング可能な幾何学を受け入れ、2D生成の洗練と3D整合性強化ツール間の相互作用をオーケストレーションします。
論文参考訳（メタデータ） (2023-09-15T16:34:51Z)
GET3D: A Generative Model of High Quality 3D Textured Shapes Learned from Images [72.15855070133425]
本稿では,複雑なトポロジ,リッチな幾何学的ディテール,高忠実度テクスチャを備えたExplicit Textured 3Dメッシュを直接生成する生成モデルであるGET3Dを紹介する。 GET3Dは、車、椅子、動物、バイク、人間キャラクターから建物まで、高品質な3Dテクスチャメッシュを生成することができる。
論文参考訳（メタデータ） (2022-09-22T17:16:19Z)
Generative VoxelNet: Learning Energy-Based Models for 3D Shape Synthesis and Analysis [143.22192229456306]
本稿では,体積形状を表す3次元エネルギーモデルを提案する。提案モデルの利点は6倍である。実験により,提案モデルが高品質な3d形状パターンを生成できることが実証された。
論文参考訳（メタデータ） (2020-12-25T06:09:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。