論文の概要: Sculpt4D: Generating 4D Shapes via Sparse-Attention Diffusion Transformers
- arxiv url: http://arxiv.org/abs/2604.21592v1
- Date: Thu, 23 Apr 2026 12:18:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.482566
- Title: Sculpt4D: Generating 4D Shapes via Sparse-Attention Diffusion Transformers
- Title(参考訳): Sculpt4D:Sparse-Attention Diffusion Transformerによる4次元形状の生成
- Authors: Minghao Yin, Wenbo Hu, Jiale Xu, Ying Shan, Kai Han,
- Abstract要約: Sculpt4Dはネイティブな4D生成フレームワークで、効率的な時間的モデリングを事前訓練された3Dトランスにシームレスに統合する。
本研究では,Sculpt4Dが時間的コヒーレントな4D合成において新たな最先端を確立し,効率的でスケーラブルな4D生成への道筋を示す。
- 参考スコア(独自算出の注目度): 70.55535980817577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent breakthroughs in 3D generative modeling have yielded remarkable progress in static shape synthesis, yet high-fidelity dynamic 4D generation remains elusive, hindered by temporal artifacts and prohibitive computational demand. We present Sculpt4D, a native 4D generative framework that seamlessly integrates efficient temporal modeling into a pretrained 3D Diffusion Transformer (Hunyuan3D 2.1), thereby mitigating the scarcity of 4D training data. At its core lies a Block Sparse Attention mechanism that preserves object identity by anchoring to the initial frame while capturing rich motion dynamics via a time-decaying sparse mask. This design faithfully models complex spatiotemporal dependencies with high fidelity, while sidestepping the quadratic overhead of full attention and reducing network total computation by 56%. Consequently, Sculpt4D establishes a new state-of-the-art in temporally coherent 4D synthesis and charts a path toward efficient and scalable 4D generation.
- Abstract(参考訳): 3D生成モデリングの最近の進歩は、静的な形状合成において顕著な進歩をもたらしたが、高忠実な動的4D生成は、時間的アーティファクトと禁忌な計算要求によって妨げられている。
本研究では,3次元拡散変換器(Hunyuan3D 2.1)に効率的な時間的モデリングをシームレスに統合するネイティブな4D生成フレームワークであるSculpt4Dについて述べる。
その中核にはBlock Sparse Attention(ブロックスパース・アテンション)機構があり、これは初期フレームに固定することでオブジェクトのアイデンティティを保ちながら、時間分解スパースマスクを介してリッチな動きのダイナミクスをキャプチャする。
この設計は、高忠実度で複雑な時空間依存性を忠実にモデル化し、フルアテンションの2次オーバーヘッドをサイドステッピングし、ネットワーク全体の計算量を56%削減する。
その結果、Sculpt4Dは、時間的コヒーレントな4D合成における新しい最先端を確立し、効率的でスケーラブルな4D生成への道を示す。
関連論文リスト
- Orthogonal Spatial-temporal Distributional Transfer for 4D Generation [58.30004328671699]
既存の3次元拡散モデルと時間的拡散モデルから豊かな空間的先行を転送し、4次元合成を強化するフレームワークを提案する。
空間・時間差4D(STD-4D)拡散モデルを構築し,空間・時間差による4D映像を合成する。
実験の結果,提案手法は従来の手法よりも優れ,空間的時間的整合性と高品質な4D合成を実現していることがわかった。
論文 参考訳(メタデータ) (2026-03-05T11:52:21Z) - Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis [53.48281548500864]
Motion 3-to-4は、単一のモノクロビデオから高品質な4Dダイナミックオブジェクトを合成するためのフィードフォワードフレームワークである。
我々のモデルは、コンパクトな動き潜在表現を学習し、フレーム単位の軌道を予測して、時間的コヒーレントな幾何である完全なロバスト性を取り戻す。
論文 参考訳(メタデータ) (2026-01-20T18:59:48Z) - SS4D: Native 4D Generative Model via Structured Spacetime Latents [50.29500511908054]
モノクロビデオから直接動的3Dオブジェクトを合成する,ネイティブな4D生成モデルであるSS4Dを提案する。
発電機を4Dデータで直接訓練し、高忠実度、時間的コヒーレンス、構造的整合性を実現する。
論文 参考訳(メタデータ) (2025-12-16T10:45:06Z) - TriDiff-4D: Fast 4D Generation through Diffusion-based Triplane Re-posing [30.542634775083112]
TriDiff-4Dは、拡散ベースの3次元平面再構成を用いて、高品質で時間的に整合した4Dアバターを生成する新しい4D生成パイプラインである。
TriDiff-4Dは、大規模な3Dおよびモーションデータセットから3D構造とモーション先行を明示的に学習することにより、時間的一貫性、運動精度、計算効率、視覚的忠実性に優れた骨格駆動の4D生成を可能にする。
論文 参考訳(メタデータ) (2025-11-20T18:59:03Z) - ShapeGen4D: Towards High Quality 4D Shape Generation from Videos [85.45517487721257]
ビデオからエンドツーエンドに1つの動的3次元表現を合成する,ネイティブなビデオから4次元の形状生成フレームワークを提案する。
本手法は,フレームごとの最適化を行なわずに,非剛性運動,体積変化,および位相遷移を正確にキャプチャする。
論文 参考訳(メタデータ) (2025-10-07T17:58:11Z) - Diffusion4D: Fast Spatial-temporal Consistent 4D Generation via Video Diffusion Models [116.31344506738816]
高速でスケーラブルな4Dコンテンツ生成のための新しいフレームワーク textbfDiffusion4D を提案する。
ダイナミックな3Dアセットの軌道ビューを合成できる4D対応ビデオ拡散モデルを開発した。
提案手法は, 生成効率と4次元幾何整合性の観点から, 従来の最先端技術を超えている。
論文 参考訳(メタデータ) (2024-05-26T17:47:34Z) - Consistent4D: Consistent 360{\deg} Dynamic Object Generation from
Monocular Video [15.621374353364468]
Consistent4Dは、モノクロビデオから4D動的オブジェクトを生成するための新しいアプローチである。
我々は、360度ダイナミックオブジェクト再構成を4次元生成問題として、退屈なマルチビューデータ収集とカメラキャリブレーションの必要性を排除した。
論文 参考訳(メタデータ) (2023-11-06T03:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。