Fugu-MT 論文翻訳(概要): Locally Attentional SDF Diffusion for Controllable 3D Shape Generation

論文の概要: Locally Attentional SDF Diffusion for Controllable 3D Shape Generation

arxiv url: http://arxiv.org/abs/2305.04461v2
Date: Tue, 9 May 2023 01:36:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-10 15:00:16.693762
Title: Locally Attentional SDF Diffusion for Controllable 3D Shape Generation
Title（参考訳）: 制御可能な3次元形状生成のための局所的注意SDF拡散
Authors: Xin-Yang Zheng, Hao Pan, Peng-Shuai Wang, Xin Tong, Yang Liu, Heung-Yeung Shum
Abstract要約: 本研究では,2次元スケッチ画像入力を用いて3次元形状をモデル化する拡散型3次元生成フレームワークを提案する。本手法は, 2段階拡散モデルを用いて構築され, その第1段階である占有拡散は, 低分解能占有場を生成し, 形状シェルを近似することを目的としている。 SDF拡散と呼ばれる第2段階は、第1段階によって決定された占有ボクセル内の高分解能符号距離場を合成し、微細な幾何を抽出する。
参考スコア（独自算出の注目度）: 24.83724829092307
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Although the recent rapid evolution of 3D generative neural networks greatly improves 3D shape generation, it is still not convenient for ordinary users to create 3D shapes and control the local geometry of generated shapes. To address these challenges, we propose a diffusion-based 3D generation framework -- locally attentional SDF diffusion, to model plausible 3D shapes, via 2D sketch image input. Our method is built on a two-stage diffusion model. The first stage, named occupancy-diffusion, aims to generate a low-resolution occupancy field to approximate the shape shell. The second stage, named SDF-diffusion, synthesizes a high-resolution signed distance field within the occupied voxels determined by the first stage to extract fine geometry. Our model is empowered by a novel view-aware local attention mechanism for image-conditioned shape generation, which takes advantage of 2D image patch features to guide 3D voxel feature learning, greatly improving local controllability and model generalizability. Through extensive experiments in sketch-conditioned and category-conditioned 3D shape generation tasks, we validate and demonstrate the ability of our method to provide plausible and diverse 3D shapes, as well as its superior controllability and generalizability over existing work. Our code and trained models are available at https://zhengxinyang.github.io/projects/LAS-Diffusion.html
Abstract（参考訳）: 最近の3次元生成ニューラルネットワークの急速な進化は3次元形状の生成を大幅に改善するが、通常のユーザが3次元形状を作成し、生成した形状の局所的な形状を制御するのに便利ではない。これらの課題に対処するため,我々は2次元スケッチ画像入力を用いて3次元形状をモデル化する拡散型SDF拡散フレームワークを提案する。本手法は二段階拡散モデルに基づいている。第1段階は占有拡散と呼ばれ、形状を近似するために低分解能占有場を生成することを目的としている。 SDF拡散と呼ばれる第2段階は、第1段階によって決定された占有ボクセル内の高分解能符号距離場を合成し、微細な幾何を抽出する。このモデルには,3次元ボクセル特徴学習のガイドとして2次元画像パッチ機能を活用し,局所制御性とモデル一般化性を大幅に向上させる,画像条件付き形状生成のための新しいビューアウェアローカルアテンション機構が組み込まれている。スケッチコンディショニングおよびカテゴリコンディショニングによる3次元形状生成タスクの広範な実験を通じて,本手法が有望かつ多様な3次元形状を提供するとともに,既存の作業よりも制御性と一般化性に優れることを示す。私たちのコードとトレーニングされたモデルはhttps://zhengxinyang.github.io/projects/las-diffusion.htmlで利用可能です。

関連論文リスト

ScenDi: 3D-to-2D Scene Diffusion Cascades for Urban Generation [53.049890350639366]
本研究では,3次元拡散モデルと2次元拡散モデルを統合した都市景観生成手法であるScenDiを提案する。粗い3Dシーンを2Dビデオ拡散のガイダンスとして活用することにより、ScenDiは入力条件に基づいて所望のシーンを生成し、正確なカメラ軌道に順応する。
論文参考訳（メタデータ） (2026-01-21T17:53:21Z)
Repurposing 2D Diffusion Models for 3D Shape Completion [14.959136858291904]
不完全点雲からの3次元形状完備化に2次元拡散モデルを適用する枠組みを提案する。本稿では3次元幾何学のコンパクトな2次元表現であるShape Atlasを紹介する。我々は,PCNおよびShapeNet-55データセットにおける結果の有効性を検証した。
論文参考訳（メタデータ） (2025-12-16T00:59:05Z)
Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation [66.75243908044538]
我々は,事前学習した2次元拡散モデルを用いたガウススプラット上での3次元直接生成手法であるZero-1-to-Gを導入する。 3D認識を取り入れるために,複雑な相関関係を捉え,生成されたスプラット間の3D一貫性を強制する,クロスビュー層とクロスアトリビュートアテンション層を導入する。これにより、Zero-1-to-Gは、事前訓練された2D拡散前処理を効果的に活用する最初の直接画像から3D生成モデルとなり、効率的なトレーニングと未確認物体への一般化が実現された。
論文参考訳（メタデータ） (2025-01-09T18:37:35Z)
Deformable 3D Shape Diffusion Model [21.42513407755273]
包括的3次元形状操作を容易にする新しい変形可能な3次元形状拡散モデルを提案する。点雲生成における最先端性能とメッシュ変形の競争結果を示す。本手法は,バーチャルリアリティの領域において,3次元形状操作の進展と新たな機会の解放のためのユニークな経路を提供する。
論文参考訳（メタデータ） (2024-07-31T08:24:42Z)
NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.772319840580074]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-27T04:09:34Z)
LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation [73.36690511083894]
本稿では,LN3Diffと呼ばれる新しいフレームワークを導入し,統一された3次元拡散パイプラインに対処する。提案手法では,3次元アーキテクチャと変分オートエンコーダを用いて,入力画像を構造化されたコンパクトな3次元潜在空間に符号化する。 3次元生成のためのShapeNetの最先端性能を実現し,モノクロ3次元再構成と条件付き3次元生成において優れた性能を示す。
論文参考訳（メタデータ） (2024-03-18T17:54:34Z)
Sculpt3D: Multi-View Consistent Text-to-3D Generation with Sparse 3D Prior [57.986512832738704]
本稿では,2次元拡散モデルを再学習することなく,抽出した参照オブジェクトから3次元先行を明示的に注入する,電流パイプラインを備えた新しいフレームワークSculpt3Dを提案する。具体的には、スパース線サンプリングによるキーポイントの監督により、高品質で多様な3次元形状を保証できることを実証する。これら2つの分離された設計は、参照オブジェクトからの3D情報を利用して、2D拡散モデルの生成品質を保ちながら、3Dオブジェクトを生成する。
論文参考訳（メタデータ） (2024-03-14T07:39:59Z)
Neural Point Cloud Diffusion for Disentangled 3D Shape and Appearance Generation [29.818827785812086]
コントロール可能な3Dアセットの生成は、映画、ゲーム、エンジニアリングにおけるコンテンツ作成やAR/VRなど、多くの実用的なアプリケーションにとって重要である。本稿では,3次元拡散モデルに対して,ハイブリッド点雲とニューラル放射場アプローチを導入することで,絡み合いを実現するための適切な表現を提案する。
論文参考訳（メタデータ） (2023-12-21T18:46:27Z)
Explorable Mesh Deformation Subspaces from Unstructured Generative Models [53.23510438769862]
3次元形状の深い生成モデルは、しばしば潜在的な変動を探索するために使用できる連続的な潜伏空間を特徴付ける。本研究では,手軽に探索可能な2次元探索空間から事前学習された生成モデルのサブ空間へのマッピングを構築することで,与えられたランドマーク形状の集合間のバリエーションを探索する手法を提案する。
論文参考訳（メタデータ） (2023-10-11T18:53:57Z)
Michelangelo: Conditional 3D Shape Generation based on Shape-Image-Text Aligned Latent Representation [47.945556996219295]
本稿では2次元画像やテキストに基づいて3次元形状を生成する新しいアライメント前世代手法を提案する。我々のフレームワークは、形状-画像-テキスト対応変分自動エンコーダ(SITA-VAE)と条件付き形状遅延拡散モデル(ASLDM)の2つのモデルで構成されている。
論文参考訳（メタデータ） (2023-06-29T17:17:57Z)
3D-LDM: Neural Implicit 3D Shape Generation with Latent Diffusion Models [8.583859530633417]
自動復号器の潜時空間で動作する3次元形状のニューラル暗黙表現のための拡散モデルを提案する。これにより、多種多様な高品質な3D表面を生成できます。
論文参考訳（メタデータ） (2022-12-01T20:00:00Z)
3D Neural Field Generation using Triplane Diffusion [37.46688195622667]
ニューラルネットワークの3次元認識のための効率的な拡散ベースモデルを提案する。当社のアプローチでは,ShapeNetメッシュなどのトレーニングデータを,連続的占有フィールドに変換することによって前処理する。本論文では,ShapeNetのオブジェクトクラスにおける3D生成の現状について述べる。
論文参考訳（メタデータ） (2022-11-30T01:55:52Z)
Deep Generative Models on 3D Representations: A Survey [81.73385191402419]
生成モデルは、新しいインスタンスを生成することによって観測データの分布を学習することを目的としている。最近、研究者は焦点を2Dから3Dにシフトし始めた。 3Dデータの表現は、非常に大きな課題をもたらします。
論文参考訳（メタデータ） (2022-10-27T17:59:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。