論文の概要: Learning Versatile 3D Shape Generation with Improved AR Models
- arxiv url: http://arxiv.org/abs/2303.14700v1
- Date: Sun, 26 Mar 2023 12:03:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 17:58:58.750984
- Title: Learning Versatile 3D Shape Generation with Improved AR Models
- Title(参考訳): 改良ARモデルによる3次元形状生成の学習
- Authors: Simian Luo, Xuelin Qian, Yanwei Fu, Yinda Zhang, Ying Tai, Zhenyu
Zhang, Chengjie Wang, Xiangyang Xue
- Abstract要約: 自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
- 参考スコア(独自算出の注目度): 91.87115744375052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Auto-Regressive (AR) models have achieved impressive results in 2D image
generation by modeling joint distributions in the grid space. While this
approach has been extended to the 3D domain for powerful shape generation, it
still has two limitations: expensive computations on volumetric grids and
ambiguous auto-regressive order along grid dimensions. To overcome these
limitations, we propose the Improved Auto-regressive Model (ImAM) for 3D shape
generation, which applies discrete representation learning based on a latent
vector instead of volumetric grids. Our approach not only reduces computational
costs but also preserves essential geometric details by learning the joint
distribution in a more tractable order. Moreover, thanks to the simplicity of
our model architecture, we can naturally extend it from unconditional to
conditional generation by concatenating various conditioning inputs, such as
point clouds, categories, images, and texts. Extensive experiments demonstrate
that ImAM can synthesize diverse and faithful shapes of multiple categories,
achieving state-of-the-art performance.
- Abstract(参考訳): 自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
このアプローチは強力な形状生成のために3Dドメインに拡張されているが、ボリュームグリッド上の高価な計算とグリッド次元に沿った曖昧な自己回帰順序という2つの制限がある。
これらの制約を克服するために,ボリュームグリッドの代わりに潜在ベクトルに基づく離散表現学習を適用した3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
提案手法は計算コストを低減させるだけでなく,より扱いやすい順序でジョイント分布を学習することで幾何学的詳細を保存できる。
さらに,モデルアーキテクチャの簡略化により,点群やカテゴリ,画像,テキストといった様々な条件付き入力を結合することで,無条件から条件付き生成へと自然に拡張することができる。
広範な実験により、imamは複数のカテゴリの多様で忠実な形状を合成し、最先端のパフォーマンスを達成することが示されている。
関連論文リスト
- MeshXL: Neural Coordinate Field for Generative 3D Foundation Models [51.1972329762843]
本稿では,現代の大規模言語モデルを用いた3次元メッシュ生成のプロセスに対処する,事前学習型自己回帰モデルの生成ファミリを提案する。
MeshXLは高品質な3Dメッシュを生成することができ、さまざまなダウンストリームアプリケーションの基盤モデルとしても機能する。
論文 参考訳(メタデータ) (2024-05-31T14:35:35Z) - NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.772319840580074]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T04:09:34Z) - Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.26563926533517]
自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文 参考訳(メタデータ) (2024-02-19T15:33:09Z) - Make-A-Shape: a Ten-Million-scale 3D Shape Model [52.701745578415796]
本稿では,大規模な効率的なトレーニングを目的とした新しい3次元生成モデルであるMake-A-Shapeを紹介する。
まずウェーブレットツリー表現を革新し、サブバンド係数フィルタリングスキームを定式化して形状をコンパクトに符号化する。
我々は、粗いウェーブレット係数の生成を効果的に学習するために、我々のモデルを訓練するためのサブバンド適応型トレーニング戦略を導出する。
論文 参考訳(メタデータ) (2024-01-20T00:21:58Z) - Pushing the Limits of 3D Shape Generation at Scale [65.24420181727615]
我々は、前例のない次元に拡大することで、3次元形状生成において画期的なブレークスルーを示す。
現在までに最大の3次元形状生成モデルとしてArgus-3Dが確立されている。
論文 参考訳(メタデータ) (2023-06-20T13:01:19Z) - 3D Generative Model Latent Disentanglement via Local Eigenprojection [13.713373496487012]
本稿では,3次元頭部および体メッシュの異なるニューラルネットワークに基づく生成モデルに対するスペクトル幾何学に基づく新しい損失関数を提案する。
実験結果から,我々の局所固有射影不整形(LED)モデルでは,最先端技術に対する不整形が改善されていることがわかった。
論文 参考訳(メタデータ) (2023-02-24T18:19:49Z) - 3DILG: Irregular Latent Grids for 3D Generative Modeling [44.16807313707137]
ニューラルネットワークとして3次元形状を符号化するための新しい表現を提案する。
この表現はトランスアーキテクチャと互換性があり、形状再構成と形状生成の両方の利点があるように設計されている。
論文 参考訳(メタデータ) (2022-05-27T11:29:52Z) - GLASS: Geometric Latent Augmentation for Shape Spaces [28.533018136138825]
幾何学的に動機づけられたエネルギーを用いて拡張し、その結果、サンプル(トレーニング)モデルのスパースコレクションを増強する。
本研究では,高剛性(ARAP)エネルギーのヘシアン解析を行い,その基礎となる(局所)形状空間に投射する。
我々は,3~10個のトレーニング形状から始めても,興味深い,意味のある形状変化の例をいくつか提示する。
論文 参考訳(メタデータ) (2021-08-06T17:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。