論文の概要: Progressive Text-to-3D Generation for Automatic 3D Prototyping
- arxiv url: http://arxiv.org/abs/2309.14600v1
- Date: Tue, 26 Sep 2023 01:08:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 15:14:44.636013
- Title: Progressive Text-to-3D Generation for Automatic 3D Prototyping
- Title(参考訳): 自動3dプロトタイピングのためのプログレッシブテキストから3d生成
- Authors: Han Yi, Zhedong Zheng, Xiangyu Xu and Tat-seng Chua
- Abstract要約: 本稿では,MTN(Multi-Scale Triplane Network)と新たなプログレッシブラーニング戦略を提案する。
本実験では,提案手法が既存手法に対して良好に動作することを確認した。
自然言語記述による自動3Dプロトタイピングの道を開くことを目指しています。
- 参考スコア(独自算出の注目度): 83.33407603057618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-3D generation is to craft a 3D object according to a natural language
description. This can significantly reduce the workload for manually designing
3D models and provide a more natural way of interaction for users. However,
this problem remains challenging in recovering the fine-grained details
effectively and optimizing a large-size 3D output efficiently. Inspired by the
success of progressive learning, we propose a Multi-Scale Triplane Network
(MTN) and a new progressive learning strategy. As the name implies, the
Multi-Scale Triplane Network consists of four triplanes transitioning from low
to high resolution. The low-resolution triplane could serve as an initial shape
for the high-resolution ones, easing the optimization difficulty. To further
enable the fine-grained details, we also introduce the progressive learning
strategy, which explicitly demands the network to shift its focus of attention
from simple coarse-grained patterns to difficult fine-grained patterns. Our
experiment verifies that the proposed method performs favorably against
existing methods. For even the most challenging descriptions, where most
existing methods struggle to produce a viable shape, our proposed method
consistently delivers. We aspire for our work to pave the way for automatic 3D
prototyping via natural language descriptions.
- Abstract(参考訳): テキストから3D生成は、自然言語の記述に従って3Dオブジェクトを作成することである。
これにより、3Dモデルを手動で設計する作業が大幅に削減され、ユーザにとってより自然なインタラクションが可能になる。
しかし,細粒度を効果的に回収し,大規模3d出力を効率的に最適化するには課題が残る。
進歩学習の成功に触発されて,マルチスケールトライプレーンネットワーク(MTN)と新しい進歩学習戦略を提案する。
名前の通り、マルチスケールのトライプレーンネットワークは4つのトライプレーンで構成され、低解像度から高解像度に遷移する。
低解像度のトライプレーンは、高分解能のトライプレーンの初期形状として機能し、最適化の困難さを和らげる。
さらに細粒度を極小にするためには、ネットワークに注意の焦点を単純な粗粒度パターンから難解な細粒度パターンにシフトさせるプログレッシブラーニング戦略も導入する。
提案手法が既存の手法に好適に作用することを検証した。
既存のほとんどのメソッドが実行可能な形状を作り出すのに苦労している最も難しい記述でさえ、提案手法は一貫して提供されます。
自然言語記述による自動3Dプロトタイピングの道を開くことを目指しています。
関連論文リスト
- Sherpa3D: Boosting High-Fidelity Text-to-3D Generation via Coarse 3D
Prior [52.44678180286886]
2次元拡散モデルでは、3次元データなしで優れた一般化と豊富な詳細を実現する蒸留手法が見つかる。
提案するSherpa3Dは,高忠実度,一般化性,幾何整合性を同時に実現する新しいテキスト・ツー・3Dフレームワークである。
論文 参考訳(メタデータ) (2023-12-11T18:59:18Z) - Instant3D: Instant Text-to-3D Generation [106.33316090614322]
Instant3Dと呼ばれる高速テキストから3D生成のための新しいフレームワークを提案する。
テキストプロンプトから3次元の3次元平面を直接構築する新しいネットワークを考案することで、この顕著なスピードを実現する。
また,従来のシグモイド関数を置き換えるために,簡易かつ効果的なシグモイド活性化関数を提案する。
論文 参考訳(メタデータ) (2023-11-14T18:59:59Z) - 3D-GPT: Procedural 3D Modeling with Large Language Models [50.57513088909881]
命令駆動3Dモデリングのための大規模言語モデル(LLM)を利用するフレームワークである3D-GPTを紹介する。
3D-GPTは、3Dモデリングタスクをアクセス可能なセグメントに分割し、各タスクにアプエージェントを割り当てる。
我々の実証調査では、3D-GPTが解釈し、指示を実行し、信頼性の高い結果を提供するだけでなく、人間デザイナーと効果的に協力することを確認した。
論文 参考訳(メタデータ) (2023-10-19T17:41:48Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal
Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - IT3D: Improved Text-to-3D Generation with Explicit View Synthesis [71.68595192524843]
本研究では、これらの問題に対処するために、明示的に合成されたマルチビュー画像を活用する新しい戦略を提案する。
我々のアプローチは、高画質画像を生成するために、LCDによって強化されたイメージ・ツー・イメージ・パイプラインを活用することである。
組込み判別器では、合成したマルチビュー画像は実データと見なされ、最適化された3Dモデルのレンダリングは偽データとして機能する。
論文 参考訳(メタデータ) (2023-08-22T14:39:17Z) - Efficient Text-Guided 3D-Aware Portrait Generation with Score
Distillation Sampling on Distribution [28.526714129927093]
本研究では,DreamPortraitを提案する。DreamPortraitは,テキスト誘導型3D画像の単一フォワードパスで効率よく作成することを目的としている。
さらに,テキストと3D認識空間の対応をモデルが明示的に知覚できるように,3D対応のゲート・アテンション機構を設計する。
論文 参考訳(メタデータ) (2023-06-03T11:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。