論文の概要: AssetGen: Deployable 3D Asset Generation at Interactive Speed
- arxiv url: http://arxiv.org/abs/2605.26137v1
- Date: Fri, 22 May 2026 04:58:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.194775
- Title: AssetGen: Deployable 3D Asset Generation at Interactive Speed
- Title(参考訳): AssetGen: インタラクティブなスピードでデプロイ可能な3Dアセット生成
- Authors: Dilin Wang, Xiaoyu Xiang, Kihyuk Sohn, Tom Monnier, Yu-Ying Yeh, Thu Nguyen-Phuoc, Jiawen Zhang, Yuchen Fan, Antoine Toisoul, Hyunyoung Jung, Prithviraj Dhar, Michael Bunnell, Nikolaos Sarafianos, Chuhang Zou, Roman Shapovalov, Andrea Vedaldi, Rakesh Ranjan,
- Abstract要約: AssetGenは、代わりにユーザエクスペリエンスとデプロイ性に焦点を当てた3Dジェネレータです。
基準画像が1つあるとすると、30秒で、焼成されたノーマル、色調、制御されたポリゴン予算を備えた高品質なメッシュが生成される。
AssetGen Flashの亜種は、インタラクティブでエージェント的な生成ループに対して、レイテンシを14秒に短縮する。
- 参考スコア(独自算出の注目度): 71.01210651881287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While 3D generation is progressing rapidly, recent work has often focused on obtaining high-resolution assets, leaving user experience and deployability as afterthoughts. We present AssetGen, a 3D generator that focuses instead on these two aspects. Given one reference image, in 30 seconds it produces a high-quality mesh with baked normals, a color texture, and a controlled polygon budget suitable for real-time rendering, including mobile use cases. The AssetGen Flash variant further reduces latency to 14 seconds for interactive and agentic creation loops. Our model generates the object geometry with a coarse-to-refine VecSet framework, which implements mesh simplification, cleaning, and normal baking on the GPU, and a fast parallel UV unwrapping. It then generates textures in a multi-view fashion, followed by backprojection and 3D inpainting. Model distillation, kernel optimization, and pipeline parallelization are co-designed to accelerate the system end-to-end. We introduce numerous automated and blind human evaluations and demonstrate competitive visual quality against leading commercial solutions in 30 seconds and preview-quality results in less than 15 seconds. The final result is a system that supports AI-assisted, deployable 3D content creation in interactive workflows.
- Abstract(参考訳): 3D生成は急速に進んでいるが、最近の研究は高解像度の資産獲得に重点を置いており、ユーザエクスペリエンスとデプロイ性は後回しとして残されている。
AssetGenは、これらの2つの側面に焦点を当てた3Dジェネレータです。
1つの参照画像が与えられた場合、30秒で、焼成された正常な高品質なメッシュ、色テクスチャ、そしてモバイルユースケースを含むリアルタイムレンダリングに適した制御されたポリゴン予算を生成する。
AssetGen Flashの亜種は、インタラクティブでエージェント的な生成ループに対して、レイテンシを14秒に短縮する。
このモデルでは,GPU上でのメッシュ単純化,クリーニング,通常のベーキングを実装した粗いVecSetフレームワークと高速並列UVアンラッピングを実装したオブジェクト形状を生成する。
その後、マルチビューでテクスチャを生成し、続いてバックプロジェクションと3Dインペイントを行う。
モデルの蒸留、カーネル最適化、パイプライン並列化は、システムのエンドツーエンドを高速化するために共同設計されている。
多数の自動化された視覚的評価を導入し、主要な商用ソリューションに対する競争力のある視覚的品質を30秒で、プレビュー品質を15秒未満で示す。
最終的な結果は、対話的なワークフローでAI支援され、デプロイ可能な3Dコンテンツ作成をサポートするシステムである。
関連論文リスト
- Efficient 3D Content Reconstruction and Generation [5.8565664251165375]
マルチビュー拡散とフィードフォワードスパース3D再構成を組み合わせることで,5~20秒で高品質な資産を創出するInstant3Dを紹介する。
私はFastMapを開発しています。これは、従来の最先端よりも最大10倍のスピードアップを実現します。
論文 参考訳(メタデータ) (2026-05-18T08:41:10Z) - Wonder3D++: Cross-domain Diffusion for High-fidelity 3D Generation from a Single Image [68.55613894952177]
単一ビュー画像から高忠実なテクスチャメッシュを効率的に生成する新しい手法である textbfWonder3D++ を導入する。
マルチビュー正規写像と対応するカラー画像を生成するクロスドメイン拡散モデルを提案する。
最後に,多視点2次元表現から高品質な表面を粗い方法でわずか3ドル程度で駆動するカスケード3次元メッシュ抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:24:18Z) - EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation [2.544527978847722]
CaPaは、高忠実度3Dアセットを効率的に生成するカーブ・アンド・ペイントのフレームワークである。
テクスチャの忠実さと幾何学的安定性に優れ、実用的でスケーラブルな3Dアセット生成のための新しい標準を確立する。
論文 参考訳(メタデータ) (2025-01-16T10:03:15Z) - Meta 3D AssetGen: Text-to-Mesh Generation with High-Quality Geometry, Texture, and PBR Materials [58.178540282148475]
AssetGenはテキストから3D生成の大幅な進歩である。
テクスチャと素材制御を備えた忠実で高品質なメッシュを生成する。
論文 参考訳(メタデータ) (2024-07-02T17:21:47Z) - HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras [45.739224968302565]
本稿では,マルチタスク3次元知覚のためのHENetというエンドツーエンドフレームワークを提案する。
具体的には,短期フレーム用大画像エンコーダと長期フレーム用小画像エンコーダを用いたハイブリッド画像エンコーダを提案する。
各認識タスクの特徴により、異なるグリッドサイズのBEV機能、独立したBEVエンコーダ、タスクデコーダを異なるタスクに活用する。
論文 参考訳(メタデータ) (2024-04-03T07:10:18Z) - DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation [55.661467968178066]
本稿では,DreamGaussianを提案する。DreamGaussianは,効率と品質を両立させる新しい3Dコンテンツ生成フレームワークである。
我々の重要な洞察は、UV空間におけるメッシュ抽出とテクスチャ改善を伴う3次元ガウススプラッティングモデルを設計することである。
ニューラル・ラジアンス・フィールドにおける占有プルーニングとは対照的に、3次元ガウスの進行的な密度化は3次元生成タスクにおいて著しく速く収束することを示した。
論文 参考訳(メタデータ) (2023-09-28T17:55:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。