論文の概要: LATTICE: Democratize High-Fidelity 3D Generation at Scale
- arxiv url: http://arxiv.org/abs/2512.03052v1
- Date: Mon, 24 Nov 2025 03:22:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:54.906674
- Title: LATTICE: Democratize High-Fidelity 3D Generation at Scale
- Title(参考訳): LATTICE:高忠実度3D世代を大規模に民主化
- Authors: Zeqiang Lai, Yunfei Zhao, Zibo Zhao, Haolin Liu, Qingxiang Lin, Jingwei Huang, Chunchao Guo, Xiangyu Yue,
- Abstract要約: LATTICEは高忠実度3Dアセット生成のための新しいフレームワークである。
VoxSetは、3Dの資産を粗いボクセル格子に固定された潜在ベクトルのコンパクトな集合に圧縮する半構造化表現である。
提案手法のコアは単純だが,任意の解像度復号化,低コストトレーニング,フレキシブル推論スキームをサポートする。
- 参考スコア(独自算出の注目度): 27.310104395842075
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present LATTICE, a new framework for high-fidelity 3D asset generation that bridges the quality and scalability gap between 3D and 2D generative models. While 2D image synthesis benefits from fixed spatial grids and well-established transformer architectures, 3D generation remains fundamentally more challenging due to the need to predict both spatial structure and detailed geometric surfaces from scratch. These challenges are exacerbated by the computational complexity of existing 3D representations and the lack of structured and scalable 3D asset encoding schemes. To address this, we propose VoxSet, a semi-structured representation that compresses 3D assets into a compact set of latent vectors anchored to a coarse voxel grid, enabling efficient and position-aware generation. VoxSet retains the simplicity and compression advantages of prior VecSet methods while introducing explicit structure into the latent space, allowing positional embeddings to guide generation and enabling strong token-level test-time scaling. Built upon this representation, LATTICE adopts a two-stage pipeline: first generating a sparse voxelized geometry anchor, then producing detailed geometry using a rectified flow transformer. Our method is simple at its core, but supports arbitrary resolution decoding, low-cost training, and flexible inference schemes, achieving state-of-the-art performance on various aspects, and offering a significant step toward scalable, high-quality 3D asset creation.
- Abstract(参考訳): LATTICEは高忠実度3Dアセット生成のための新しいフレームワークであり、3D生成モデルと2D生成モデルの間の品質とスケーラビリティのギャップを埋めるものである。
2次元画像合成は、固定空間格子とよく確立されたトランスフォーマーアーキテクチャから恩恵を受けるが、空間構造と詳細な幾何学的表面の両方をスクラッチから予測する必要があるため、基本的には困難である。
これらの課題は、既存の3D表現の計算複雑性と、構造化されたスケーラブルな3Dアセット符号化スキームの欠如によって悪化する。
これを解決するために,VoxSetを提案する。これは3次元の資産を粗いボクセル格子に固定された潜在ベクトルのコンパクトな集合に圧縮し,効率よく位置認識できるような半構造化表現である。
VoxSetは、遅延空間に明示的な構造を導入しながら、以前のVecSetメソッドの単純さと圧縮の利点を保ち、位置埋め込みによって生成をガイドし、強力なトークンレベルのテストタイムスケーリングを可能にする。
この表現に基づいて、LATTICEは2段階のパイプラインを採用しており、まずはスパースなボキセル化幾何アンカーを生成し、次に整流トランスフォーマーを使用して詳細な幾何学を生成する。
提案手法のコアは単純だが,任意の解像度復号化,低コストトレーニング,フレキシブル推論スキームをサポートし,様々な面において最先端の性能を実現し,スケーラブルで高品質な3Dアセット作成に向けて大きな一歩を踏み出した。
関連論文リスト
- Light-SQ: Structure-aware Shape Abstraction with Superquadrics for Generated Meshes [60.92139345612904]
我々は、新しいスーパークワッドリックベースの最適化フレームワークLight-SQを提案する。
本稿では,構造対応ボリューム分解によるブロック再配置戦略を提案する。
実験によると、Light-SQはスーパークワッドリックで効率よく、高忠実で、編集可能な形状の抽象化を可能にする。
論文 参考訳(メタデータ) (2025-09-29T16:18:32Z) - Ultra3D: Efficient and High-Fidelity 3D Generation with Part Attention [54.15345846343084]
品質を損なうことなくスパースボクセルモデリングを大幅に高速化する,効率的な3D生成フレームワークであるUltra3Dを提案する。
部分注意(Part Attention)は、意味的に一貫した部分領域内での注意計算を制限する幾何学的な局所的注意機構である。
実験により、Ultra3Dは1024の解像度で高解像度の3D生成をサポートし、視覚的忠実度とユーザの好みの両方で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-07-23T17:57:16Z) - Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets [90.99212668875971]
Step1X-3Dは、データの不足、アルゴリズムの制限、エコシステムの断片化といった課題に対処するオープンフレームワークである。
拡散型テクスチャ合成モジュールとハイブリッドVAE-DiTジオメトリジェネレータを組み合わせた2段階の3Dネイティブアーキテクチャを提案する。
ベンチマークの結果は、既存のオープンソースメソッドを超える最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-05-12T16:56:30Z) - GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。