論文の概要: Pose-Aware Diffusion for 3D Generation
- arxiv url: http://arxiv.org/abs/2605.00345v1
- Date: Fri, 01 May 2026 02:05:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.818665
- Title: Pose-Aware Diffusion for 3D Generation
- Title(参考訳): ポスアウェア拡散による3次元生成
- Authors: Zihan Zhou, Luxi Chen, Jingzhi Zhou, Yuhao Wan, Min Zhao, Baoyu Fan, Chongxuan Li,
- Abstract要約: Pose-Aware Diffusion (PAD)は、観測空間内で直接3次元幾何学を合成する新しいエンドツーエンド拡散フレームワークである。
PADは最先端の手法よりも優れた幾何学的アライメントと画像から3D対応を実現している。
- 参考スコア(独自算出の注目度): 27.05951575490971
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating pose-aligned 3D objects is challenging due to the spatial mismatches and transformation ambiguities inherent in decoupled canonical-then-rotate paradigms. To this end, we introduce Pose-Aware Diffusion (PAD), a novel end-to-end diffusion framework that synthesizes 3D geometry directly within the observation space. By unprojecting monocular depth into a partial point cloud and explicitly injecting it as a 3D geometric anchor, PAD abandons canonical assumptions to enforce rigorous spatial supervision. This native generation intrinsically resolves pose ambiguity, producing high-fidelity pose-aligned assets. Extensive experiments demonstrate that PAD achieves superior geometric alignment and image-to-3D correspondence compared to state-of-the-art methods. Additionally, PAD naturally extends to compositional 3D scene reconstruction via a simple union of independently generated objects, highlighting its robust ability to preserve precise spatial layouts.
- Abstract(参考訳): 空間的ミスマッチや、デカップリングされた標準-理論-回転パラダイムに固有の変換の曖昧さのため、ポーズアラインな3Dオブジェクトの生成は困難である。
この目的のために,観測空間内で直接3次元幾何学を合成する新しいエンドツーエンド拡散フレームワークであるPose-Aware Diffusion (PAD)を紹介した。
単分子深度を部分点雲に投射し、それを3次元幾何学的アンカーとして明示的に注入することにより、PADは厳密な空間監視を実施するための標準仮定を放棄する。
このネイティブ世代は本質的には曖昧さを解消し、高忠実なポーズ整列資産を生み出している。
広汎な実験により、PADは最先端の手法に比べて優れた幾何学的アライメントと画像から3D対応を実現することが示された。
さらに、PADは独立に生成されたオブジェクトの単純な結合によって構成的な3Dシーンの再構成に自然に拡張し、正確な空間配置を保存する堅牢な能力を強調している。
関連論文リスト
- Extend3D: Town-Scale 3D Generation [31.052455723067684]
1枚の画像から3Dシーンを生成するためのトレーニング不要パイプラインであるExtended3Dを提案する。
拡張潜在空間を重なり合うパッチに分割することにより、各パッチにオブジェクト中心の3D生成モデルを適用し、各ステップで結合する。
3次元リファインメントにおける3次元構造の不完全さをノイズとして扱うことにより,低騒音という概念による3次元合成が可能となる。
論文 参考訳(メタデータ) (2026-03-31T07:55:04Z) - OneWorld: Taming Scene Generation with 3D Unified Representation Autoencoder [90.8453349494245]
本研究では,コヒーレントな3次元表現空間内で直接拡散を行うOneWorldを提案する。
OneWorldは、最先端の2Dベースの方法と比較して、クロスビューの一貫性に優れた高品質な3Dシーンを生成する。
論文 参考訳(メタデータ) (2026-03-17T03:43:37Z) - Interact3D: Compositional 3D Generation of Interactive Objects [31.12099147294145]
本稿では,3次元合成オブジェクト間の相互作用を物理的に妥当に生成する新しいフレームワークを提案する。
当社のアプローチは、まず先進的な先進的な先進的手法を活用して、高品質な個人資産をキュレートする。
これらの資産を物理的に構成するために、ロバストな2段階合成パイプラインを導入する。
論文 参考訳(メタデータ) (2026-03-17T03:21:06Z) - SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection [49.12928389918159]
既存の単分子3D検出器は典型的には、切り離された予測パラダイムを通じて、3D境界ボックスの顕著な非線形回帰をテームする。
本稿では2つの主成分を持つ新しい空間射影アライメント(SPAN)を提案する。
SPANは、予測された3次元境界ボックスと接地した3次元境界ボックスの間に明らかに大域的な空間的制約を課し、それによって非結合な特性回帰による空間的ドリフトを補正する。
3D-2Dプロジェクションアライメントは、投影された3Dボックスが、画像平面上の対応する2D検出バウンディングボックス内に密に整列していることを保証する。
論文 参考訳(メタデータ) (2025-11-10T04:48:48Z) - CUPID: Pose-Grounded Generative 3D Reconstruction from a Single Image [32.39661961097445]
カメラのポーズ,3次元形状,テクスチャを1枚の2次元画像から推定する。
実験では、3dB以上のPSNRゲインと10%以上のチャンファー距離減少を伴い、3D再構成法を先導するキューピッドのパフォーマンスが実証された。
論文 参考訳(メタデータ) (2025-10-23T17:47:38Z) - GaussianAnything: Interactive Point Cloud Flow Matching For 3D Object Generation [75.39457097832113]
本稿では,インタラクティブなポイントクラウド構造ラテント空間を備えたスケーラブルで高品質な3D生成を実現する,新しい3D生成フレームワークを提案する。
本フレームワークでは,複数ビューのRGB-D(epth)-N(ormal)レンダリングを入力として使用する変分オートエンコーダを,3次元形状情報を保存する独自のラテント空間設計を用いて構成する。
提案手法であるGaussianAnythingは,複数モード条件付き3D生成をサポートし,ポイントクラウド,キャプション,単一画像入力を可能にする。
論文 参考訳(メタデータ) (2024-11-12T18:59:32Z) - NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.772319840580074]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T04:09:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。