論文の概要: BridgeShape: Latent Diffusion Schrödinger Bridge for 3D Shape Completion
- arxiv url: http://arxiv.org/abs/2506.23205v1
- Date: Sun, 29 Jun 2025 12:21:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.773001
- Title: BridgeShape: Latent Diffusion Schrödinger Bridge for 3D Shape Completion
- Title(参考訳): BridgeShape: 3次元形状完成のための遅延拡散シュレーディンガー橋
- Authors: Dequan Kong, Zhe Zhu, Honghua Chen, Mingqiang Wei,
- Abstract要約: BridgeShapeは、潜伏拡散型Schr"odingerブリッジによる3次元形状完成のための新しいフレームワークである。
本稿では,Depth-Enhanced Vector Quantized Variational Autoencoder (VQ-VAE)を導入し,3次元形状をコンパクトな潜在空間に符号化する。
BridgeShapeは、大規模な3D形状補完ベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 20.704173763035488
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing diffusion-based 3D shape completion methods typically use a conditional paradigm, injecting incomplete shape information into the denoising network via deep feature interactions (e.g., concatenation, cross-attention) to guide sampling toward complete shapes, often represented by voxel-based distance functions. However, these approaches fail to explicitly model the optimal global transport path, leading to suboptimal completions. Moreover, performing diffusion directly in voxel space imposes resolution constraints, limiting the generation of fine-grained geometric details. To address these challenges, we propose BridgeShape, a novel framework for 3D shape completion via latent diffusion Schr\"odinger bridge. The key innovations lie in two aspects: (i) BridgeShape formulates shape completion as an optimal transport problem, explicitly modeling the transition between incomplete and complete shapes to ensure a globally coherent transformation. (ii) We introduce a Depth-Enhanced Vector Quantized Variational Autoencoder (VQ-VAE) to encode 3D shapes into a compact latent space, leveraging self-projected multi-view depth information enriched with strong DINOv2 features to enhance geometric structural perception. By operating in a compact yet structurally informative latent space, BridgeShape effectively mitigates resolution constraints and enables more efficient and high-fidelity 3D shape completion. BridgeShape achieves state-of-the-art performance on large-scale 3D shape completion benchmarks, demonstrating superior fidelity at higher resolutions and for unseen object classes.
- Abstract(参考訳): 既存の拡散型3次元形状補完法は、通常条件付きパラダイムを用いており、深い特徴相互作用(例えば、結合性、交差注意)を通してデノナイズネットワークに不完全な形状情報を注入し、サンプリングを完全な形状へと導く。
しかしながら、これらのアプローチは最適なグローバルトランスポートパスを明示的にモデル化することができず、最適以下の完備化につながる。
さらに、ボクセル空間で直接拡散を行うことは分解の制約を課し、微粒な幾何学的詳細の生成を制限する。
これらの課題に対処するために,潜伏拡散Schr\"odinger Bridgeによる3次元形状補完のための新しいフレームワークであるBridgeShapeを提案する。
重要なイノベーションは2つの側面にある。
(i)BridgeShapeは、形状完備化を最適な輸送問題として定式化し、不完全形と完全形の間の遷移を明示的にモデル化し、世界的コヒーレントな変換を保証する。
(II)DINOv2特徴量に富んだ自己投影型多視点深度情報を利用して、3次元形状をコンパクトな潜在空間に符号化する深部ベクトル量子化変分オートコーダ(VQ-VAE)を導入する。
コンパクトで構造的に有意な潜在空間で操作することで、BridgeShapeは解決の制約を効果的に緩和し、より効率的で高忠実な3D形状の完成を可能にする。
BridgeShapeは、大規模3次元形状補完ベンチマークで最先端のパフォーマンスを実現し、高解像度および見えないオブジェクトクラスにおいて優れた忠実性を示す。
関連論文リスト
- Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling [34.238349310770886]
Sarc3Dはスパース変形可能なマーチングキューブ表現と新しいエンコーダSparconv-VAEを組み合わせた統一フレームワークである。
Sparc3Dは、オープンサーフェス、切断されたコンポーネント、複雑な幾何学を含む挑戦的な入力に対して、最先端の再構築忠実性を達成する。
論文 参考訳(メタデータ) (2025-05-20T15:44:54Z) - SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling [79.56581753856452]
SparseFlexは、新しいスパース構造のアイソサーフェス表現で、レンダリング損失から最大10243ドルの解像度で、差別化可能なメッシュ再構築を可能にする。
SparseFlexは、高解像度で差別化可能なメッシュ再構成とレンダリングロスによる生成を可能にすることで、3D形状の表現とモデリングの最先端性を著しく向上させる。
論文 参考訳(メタデータ) (2025-03-27T17:46:42Z) - Hyper3D: Efficient 3D Representation via Hybrid Triplane and Octree Feature for Enhanced 3D Shape Variational Auto-Encoders [43.61384205458698]
3Dコンテンツ生成パイプラインは、しばしば変分オートエンコーダ(VAE)を利用して、形状をコンパクトな潜在表現にエンコードする。
我々は,ハイブリッド3次元平面とオクツリーを融合した効率的な3次元表現により,VAE再構成を向上するHyper3Dを紹介する。
実験の結果,Hyper3Dは3次元形状を高忠実度で細部まで再現することで従来の表現よりも優れていた。
論文 参考訳(メタデータ) (2025-03-13T14:26:43Z) - NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.772319840580074]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T04:09:34Z) - SC-Diff: 3D Shape Completion with Latent Diffusion Models [4.913210912019975]
本稿では, 形状の完成に最適化された3次元潜在拡散モデルを用いて, 3次元形状完備化手法を提案する。
本手法は,空間的コンディショニングとクロスアテンションによる画像ベースコンディショニングを,キャプチャー部分スキャンからの3次元特徴の統合により組み合わせたものである。
論文 参考訳(メタデータ) (2024-03-19T06:01:11Z) - Robust 3D Tracking with Quality-Aware Shape Completion [67.9748164949519]
そこで本研究では,高密度および完全点の雲からなる合成対象表現について,ロバストな3次元追跡のための形状完備化により正確に表現する。
具体的には, 形状が整ったボキセル化3次元追跡フレームワークを設計し, ノイズのある歴史的予測の悪影響を軽減するために, 品質に配慮した形状完備化機構を提案する。
論文 参考訳(メタデータ) (2023-12-17T04:50:24Z) - Surf-D: Generating High-Quality Surfaces of Arbitrary Topologies Using Diffusion Models [83.35835521670955]
Surf-Dは任意の位相を持つ表面として高品質な3次元形状を生成する新しい方法である。
非符号距離場(UDF)を曲面表現として用いて任意の位相を許容する。
また、ポイントベースのAutoEncoderを用いて、UDFを正確に符号化するためのコンパクトで連続的な潜在空間を学習する新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2023-11-28T18:56:01Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - Deep Implicit Templates for 3D Shape Representation [70.9789507686618]
深い暗黙表現における明示的な対応推論を支援する新しい3次元形状表現を提案する。
我々のキーとなる考え方は、テンプレートの暗黙関数の条件変形としてDIFを定式化することである。
提案手法は,形状の集合に対する一般的な暗黙テンプレートを学習するだけでなく,すべての形状を相互に同時に対応させることも可能であることを示す。
論文 参考訳(メタデータ) (2020-11-30T06:01:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。