論文の概要: Rethinking 3D Shape Generation: Diffusion over Superquadrics
- arxiv url: http://arxiv.org/abs/2606.08957v1
- Date: Mon, 08 Jun 2026 02:59:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.665762
- Title: Rethinking 3D Shape Generation: Diffusion over Superquadrics
- Title(参考訳): 3次元形状生成を再考する:スーパークワッドリックの拡散
- Authors: Zhiyang Liu, Wanze Li, Yuwei Wu, Chengran Yuan, Jiawei Sun, Rui Zheng, Marcelo H Ang,
- Abstract要約: 拡散モデルには先進的な3次元形状の生成があるが、ほとんどの手法は依然として高次心電図空間で認知されている。
本稿では,高密度な幾何学からコンパクトな幾何学的原始体への拡散を,各形状を小集合のスーパークワッドリックとして表現することを提案する。
- 参考スコア(独自算出の注目度): 22.574772158691548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have advanced 3D shape generation, yet most methods still denoise in high-cardinality spaces (e.g., voxel/SDF grids, meshes, or point clouds), which is computationally and memory intensive and makes it difficult to scale in terms of both higher resolution and stronger controllability. We rethink the diffusion representation and propose to move diffusion from dense geometry to compact geometric primitives, representing each shape as a small set of superquadrics. Instead of operating on thousands to millions of geometric representation values, we leverage 7KB superquadric parameters (pose, size, and shape), drastically reducing diffusion-state dimensionality and per-step compute/memory. Our diffusion-over-superquadrics improves scalability by supporting broader capabilities (e.g., resolution-free point-cloud decoding, part-level editing, and constraint-based design) and achieving competitive surface-fidelity and distributional performance on standard benchmarks after point-cloud decoding, while enabling efficient generation within 0.6s per shape for most conditions.
- Abstract(参考訳): 拡散モデルには高度な3次元形状の生成があるが、ほとんどの手法は高解像度空間(例えば、ボクセル/SDFグリッド、メッシュ、ポイントクラウドなど)でいまだにデノベートしている。
拡散表現を再考し、高密度な幾何学からコンパクトな幾何学的原始体への拡散を、各形状を小さなスーパークワッドリックの集合として表現することを提案する。
数千から数百万の幾何学的表現値を操作する代わりに、7KBの超二次パラメータ(目的、サイズ、形状)を活用し、拡散状態の次元とステップ毎の計算/メモリを大幅に削減する。
我々の拡散オーバ・スーパークワッドリックは、より広範な機能(例えば、分解能のないポイントクラウドデコーディング、部分レベルの編集、制約ベースの設計)をサポートし、ポイントクラウドデコーディング後の標準ベンチマーク上での競合する表面忠実性と分散性能を実現し、ほとんどの条件において、0.6秒以内の効率的な生成を実現し、スケーラビリティを向上させる。
関連論文リスト
- BridgeShape: Latent Diffusion Schrödinger Bridge for 3D Shape Completion [20.704173763035488]
BridgeShapeは、潜伏拡散型Schr"odingerブリッジによる3次元形状完成のための新しいフレームワークである。
本稿では,Depth-Enhanced Vector Quantized Variational Autoencoder (VQ-VAE)を導入し,3次元形状をコンパクトな潜在空間に符号化する。
BridgeShapeは、大規模な3D形状補完ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-06-29T12:21:21Z) - Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling [34.238349310770886]
Sarc3Dはスパース変形可能なマーチングキューブ表現と新しいエンコーダSparconv-VAEを組み合わせた統一フレームワークである。
Sparc3Dは、オープンサーフェス、切断されたコンポーネント、複雑な幾何学を含む挑戦的な入力に対して、最先端の再構築忠実性を達成する。
論文 参考訳(メタデータ) (2025-05-20T15:44:54Z) - SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling [79.56581753856452]
SparseFlexは、新しいスパース構造のアイソサーフェス表現で、レンダリング損失から最大10243ドルの解像度で、差別化可能なメッシュ再構築を可能にする。
SparseFlexは、高解像度で差別化可能なメッシュ再構成とレンダリングロスによる生成を可能にすることで、3D形状の表現とモデリングの最先端性を著しく向上させる。
論文 参考訳(メタデータ) (2025-03-27T17:46:42Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [90.23688195918432]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based
View Synthesis [70.40950409274312]
我々は、細い構造を再構築する能力を損なうことなく、表面への収束を促すために密度場を変更する。
また, メッシュの単純化と外観モデルの適合により, 融合型メッシュ方式を開発した。
私たちのモデルで生成されたコンパクトメッシュは、モバイルデバイス上でリアルタイムでレンダリングできます。
論文 参考訳(メタデータ) (2024-02-19T18:59:41Z) - Make-A-Shape: a Ten-Million-scale 3D Shape Model [52.701745578415796]
本稿では,大規模な効率的なトレーニングを目的とした新しい3次元生成モデルであるMake-A-Shapeを紹介する。
まずウェーブレットツリー表現を革新し、サブバンド係数フィルタリングスキームを定式化して形状をコンパクトに符号化する。
我々は、粗いウェーブレット係数の生成を効果的に学習するために、我々のモデルを訓練するためのサブバンド適応型トレーニング戦略を導出する。
論文 参考訳(メタデータ) (2024-01-20T00:21:58Z) - Surf-D: Generating High-Quality Surfaces of Arbitrary Topologies Using Diffusion Models [83.35835521670955]
Surf-Dは任意の位相を持つ表面として高品質な3次元形状を生成する新しい方法である。
非符号距離場(UDF)を曲面表現として用いて任意の位相を許容する。
また、ポイントベースのAutoEncoderを用いて、UDFを正確に符号化するためのコンパクトで連続的な潜在空間を学習する新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2023-11-28T18:56:01Z) - Learning Versatile 3D Shape Generation with Improved AR Models [91.87115744375052]
自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
論文 参考訳(メタデータ) (2023-03-26T12:03:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。