論文の概要: DreamPartGen: Semantically Grounded Part-Level 3D Generation via Collaborative Latent Denoising
- arxiv url: http://arxiv.org/abs/2603.19216v1
- Date: Thu, 19 Mar 2026 17:58:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.322511
- Title: DreamPartGen: Semantically Grounded Part-Level 3D Generation via Collaborative Latent Denoising
- Title(参考訳): DreamPartGen: 協力的遅延デノイングによるパートレベル3Dジェネレーション
- Authors: Tianjiao Yu, Xinzhuo Li, Muntasir Wahed, Jerry Xiong, Yifan Shen, Ying Shen, Ismini Lourentzou,
- Abstract要約: 本研究では,DreamPartGenを提案する。
コヒーレントで解釈可能なテキストアライメント3合成を可能にするコヒーレントな幾何整合性を実現する。
- 参考スコア(独自算出の注目度): 12.282331512159473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding and generating 3D objects as compositions of meaningful parts is fundamental to human perception and reasoning. However, most text-to-3D methods overlook the semantic and functional structure of parts. While recent part-aware approaches introduce decomposition, they remain largely geometry-focused, lacking semantic grounding and failing to model how parts align with textual descriptions or their inter-part relations. We propose DreamPartGen, a framework for semantically grounded, part-aware text-to-3D generation. DreamPartGen introduces Duplex Part Latents (DPLs) that jointly model each part's geometry and appearance, and Relational Semantic Latents (RSLs) that capture inter-part dependencies derived from language. A synchronized co-denoising process enforces mutual geometric and semantic consistency, enabling coherent, interpretable, and text-aligned 3D synthesis. Across multiple benchmarks, DreamPartGen delivers state-of-the-art performance in geometric fidelity and text-shape alignment.
- Abstract(参考訳): 3Dオブジェクトを意味のある部分の合成として理解し、生成することは、人間の知覚と推論に不可欠である。
しかし、ほとんどのテキストから3Dメソッドは、部品の意味的構造と機能的構造を見落としている。
最近の部分認識アプローチは分解を導入しているが、それらは主に幾何学に焦点を絞っており、意味的基盤が欠如しており、部品がテキストの記述や部分間の関係とどのように整合するかをモデル化することができない。
本研究では,DreamPartGenを提案する。
DreamPartGenは、各部分の幾何学と外観を共同でモデル化するDPL(Duplex Part Latents)と、言語から派生した部分間の依存関係をキャプチャするRSL(Relational Semantic Latents)を紹介する。
シンクロナイズドコデノナイジングプロセスは、相互幾何学的および意味的一貫性を強制し、コヒーレント、解釈可能、およびテキスト整列3D合成を可能にする。
複数のベンチマークでDreamPartGenは、幾何学的忠実度とテキスト整列における最先端のパフォーマンスを提供する。
関連論文リスト
- Part-Aware Open-Vocabulary 3D Affordance Grounding via Prototypical Semantic and Geometric Alignment [15.545435413394882]
インテリジェンスと人間とAIの相互作用を具体化するためには、自然言語の問題を3Dオブジェクト内の機能的に関連のある領域に接地することが不可欠である。
そこで本稿では,オープンな3次元空間における意味的表現と幾何学的表現を両立させる2段階のクロスモーダルフレームワークを提案する。
提案手法の有効性を,新たに導入されたベンチマークと2つの既存ベンチマークで検証し,既存手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2026-03-18T12:07:42Z) - Unified Semantic Transformer for 3D Scene Understanding [55.415468022487005]
我々は、単一のモデル内に多様な3Dセマンティックタスクを統一する新しいフィードフォワードニューラルネットワークUNITEを紹介する。
我々のモデルは、完全なエンドツーエンドで見えないシーンで動作し、完全な3Dセマンティックジオメトリを推測するのにほんの数秒しかかからない。
UNITEはいくつかの異なる意味的タスクにおいて最先端のパフォーマンスを達成し、タスク固有のモデルよりも優れていることを実証する。
論文 参考訳(メタデータ) (2025-12-16T12:49:35Z) - PartNeXt: A Next-Generation Dataset for Fine-Grained and Hierarchical 3D Part Understanding [65.55036443711528]
PartNeXtは、23,000以上の高品質なテクスチャ付き3Dモデルを持つ次世代データセットで、50のカテゴリにわたるきめ細かな階層的なパーツラベルがアノテートされている。
そこで我々は,(1)クラス非依存な部分分割,最先端の手法が細粒度や葉のレベルに苦しむ部分分割,(2)3D部分中心の質問応答,(3)オープン語彙の部分接地における大きなギャップを明らかにする3D-LLMsの新しいベンチマークの2つのタスクについて,PartNeXtをベンチマークした。
論文 参考訳(メタデータ) (2025-10-23T03:06:08Z) - From One to More: Contextual Part Latents for 3D Generation [38.36190651170286]
CoPartは、コヒーレントなマルチパーツ生成のために、3Dオブジェクトをコンテキスト部分潜在子に分解する、部分認識拡散フレームワークである。
そこで我々は,メッシュセグメンテーションと人間検証アノテーションから得られた新しい3次元部分データセットを構築した。
実験では、パートレベルの編集、オブジェクト生成、シーン構成において、前例のない制御性を持つCoPartの優れた能力を実証した。
論文 参考訳(メタデータ) (2025-07-11T17:33:18Z) - OmniPart: Part-Aware 3D Generation with Semantic Decoupling and Structural Cohesion [31.767548415448957]
我々は,パートアウェアな3Dオブジェクト生成のための新しいフレームワークであるOmniPartを紹介する。
提案手法は,ユーザ定義部分の粒度,高精度なローカライゼーションをサポートし,多様な下流アプリケーションを実現する。
論文 参考訳(メタデータ) (2025-07-08T16:46:15Z) - PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers [29.52313100024294]
1枚のRGB画像から複数の意味論的および幾何学的に異なる3Dメッシュを共同で合成する最初の構造化3D生成モデルであるPartCrafterを紹介する。
PartCrafterは同時に複数の3Dパーツを識別し、個々のオブジェクトと複雑な複数オブジェクトのシーンの両方をエンドツーエンドで生成する。
実験によると、PartCrafterは分解可能な3Dメッシュの生成において、既存のアプローチよりも優れています。
論文 参考訳(メタデータ) (2025-06-05T20:30:28Z) - PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models [63.1432721793683]
テキスト,画像,構造化されていない3Dオブジェクトから意味のある部分からなる3Dオブジェクトを生成する新しいアプローチであるPartGenを紹介する。
提案手法は, 生成された実物および実物の3次元資産に対して評価し, セグメンテーションおよび部分抽出ベースラインを大きなマージンで上回っていることを示す。
論文 参考訳(メタデータ) (2024-12-24T18:59:43Z) - 3D Part Segmentation via Geometric Aggregation of 2D Visual Features [57.20161517451834]
監督された3D部分分割モデルは、固定されたオブジェクトと部品のセットに合わせて調整されており、それらの転送可能性は、オープンセットの現実世界のシナリオに制限される。
近年、視覚言語モデル(VLM)を多視点レンダリングとテキストプロンプトを用いてオブジェクト部品の識別に活用する研究が進められている。
これらの制約に対処するために,視覚概念から抽出した意味論と3次元幾何学をブレンドし,対象部品を効果的に同定するCOPSを提案する。
論文 参考訳(メタデータ) (2024-12-05T15:27:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。