論文の概要: 3DILG: Irregular Latent Grids for 3D Generative Modeling
- arxiv url: http://arxiv.org/abs/2205.13914v1
- Date: Fri, 27 May 2022 11:29:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 14:56:40.958837
- Title: 3DILG: Irregular Latent Grids for 3D Generative Modeling
- Title(参考訳): 3DILG: 3次元生成モデリングのための不規則遅延格子
- Authors: Biao Zhang, Matthias Nie{\ss}ner, Peter Wonka
- Abstract要約: ニューラルネットワークとして3次元形状を符号化するための新しい表現を提案する。
この表現はトランスアーキテクチャと互換性があり、形状再構成と形状生成の両方の利点があるように設計されている。
- 参考スコア(独自算出の注目度): 44.16807313707137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new representation for encoding 3D shapes as neural fields. The
representation is designed to be compatible with the transformer architecture
and to benefit both shape reconstruction and shape generation. Existing works
on neural fields are grid-based representations with latents defined on a
regular grid. In contrast, we define latents on irregular grids, enabling our
representation to be sparse and adaptive. In the context of shape
reconstruction from point clouds, our shape representation built on irregular
grids improves upon grid-based methods in terms of reconstruction accuracy. For
shape generation, our representation promotes high-quality shape generation
using auto-regressive probabilistic models. We show different applications that
improve over the current state of the art. First, we show results for
probabilistic shape reconstruction from a single higher resolution image.
Second, we train a probabilistic model conditioned on very low resolution
images. Third, we apply our model to category-conditioned generation. All
probabilistic experiments confirm that we are able to generate detailed and
high quality shapes to yield the new state of the art in generative 3D shape
modeling.
- Abstract(参考訳): ニューラルネットワークとして3次元形状を符号化するための新しい表現を提案する。
この表現はトランスアーキテクチャと互換性があり、形状再構成と形状生成の両方の利点があるように設計されている。
既存のニューラルフィールドの作業は、格子ベースの表現であり、遅延は正規格子上で定義される。
対照的に、不規則なグリッド上での潜在性を定義し、表現がスパースかつ適応的になるようにします。
点雲からの形状復元の文脈において,不規則な格子上に構築した形状表現は,再構成精度の観点からグリッドベース手法により改善される。
形状生成では, 自己回帰確率モデルを用いて高品質な形状生成を促進する。
アートの現在の状況を改善する、さまざまなアプリケーションを示します。
まず,高解像度画像からの確率的形状再構成の結果を示す。
第二に、超低解像度画像に条件付確率モデルを訓練する。
第3に、我々のモデルをカテゴリー条件付き生成に適用する。
すべての確率論的実験により、精細で高品質な形状を生成でき、生成的3次元形状モデリングにおける新しい技術が得られることが確認された。
関連論文リスト
- Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.26563926533517]
自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文 参考訳(メタデータ) (2024-02-19T15:33:09Z) - Make-A-Shape: a Ten-Million-scale 3D Shape Model [52.701745578415796]
本稿では,大規模な効率的なトレーニングを目的とした新しい3次元生成モデルであるMake-A-Shapeを紹介する。
まずウェーブレットツリー表現を革新し、サブバンド係数フィルタリングスキームを定式化して形状をコンパクトに符号化する。
我々は、粗いウェーブレット係数の生成を効果的に学習するために、我々のモデルを訓練するためのサブバンド適応型トレーニング戦略を導出する。
論文 参考訳(メタデータ) (2024-01-20T00:21:58Z) - Michelangelo: Conditional 3D Shape Generation based on Shape-Image-Text
Aligned Latent Representation [47.945556996219295]
本稿では2次元画像やテキストに基づいて3次元形状を生成する新しいアライメント前世代手法を提案する。
我々のフレームワークは、形状-画像-テキスト対応変分自動エンコーダ(SITA-VAE)と条件付き形状遅延拡散モデル(ASLDM)の2つのモデルで構成されている。
論文 参考訳(メタデータ) (2023-06-29T17:17:57Z) - Learning Versatile 3D Shape Generation with Improved AR Models [91.87115744375052]
自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
論文 参考訳(メタデータ) (2023-03-26T12:03:18Z) - 3DShape2VecSet: A 3D Shape Representation for Neural Fields and
Generative Diffusion Models [42.928400751670935]
3DShape2VecSetは、生成拡散モデルのために設計されたニューラルネットワークのための新しい形状表現である。
その結果,3次元形状符号化および3次元形状生成モデルタスクの性能が向上した。
論文 参考訳(メタデータ) (2023-01-26T22:23:03Z) - 3D-LDM: Neural Implicit 3D Shape Generation with Latent Diffusion Models [8.583859530633417]
自動復号器の潜時空間で動作する3次元形状のニューラル暗黙表現のための拡散モデルを提案する。
これにより、多種多様な高品質な3D表面を生成できます。
論文 参考訳(メタデータ) (2022-12-01T20:00:00Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Autoregressive 3D Shape Generation via Canonical Mapping [92.91282602339398]
トランスフォーマーは、画像、音声、テキスト生成など、様々な生成タスクで顕著なパフォーマンスを示している。
本稿では,変圧器のパワーをさらに活用し,それを3Dポイントクラウド生成のタスクに活用することを目的とする。
条件付き形状生成への応用として,本モデルを簡単にマルチモーダル形状完成に拡張することができる。
論文 参考訳(メタデータ) (2022-04-05T03:12:29Z) - PolyGen: An Autoregressive Generative Model of 3D Meshes [22.860421649320287]
本稿では,Transformerベースのアーキテクチャを用いてメッシュを直接モデル化するアプローチを提案する。
我々のモデルは、オブジェクトクラス、ボクセル、イメージなど、様々な入力を条件にすることができる。
このモデルでは、高品質で使い勝手の良いメッシュを生成でき、メッシュモデリングタスクのためのログライクなベンチマークを確立することができる。
論文 参考訳(メタデータ) (2020-02-23T17:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。