論文の概要: TopoMesh: High-Fidelity Mesh Autoencoding via Topological Unification
- arxiv url: http://arxiv.org/abs/2603.24278v1
- Date: Wed, 25 Mar 2026 13:10:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.301281
- Title: TopoMesh: High-Fidelity Mesh Autoencoding via Topological Unification
- Title(参考訳): TopoMesh: トポロジカル統一による高忠実度メッシュ自動エンコーディング
- Authors: Guan Luo, Xiu Li, Rui Chen, Xuanyu Yi, Jing Lin, Chia-Hao Chen, Jiahang Liu, Song-Hai Zhang, Jianfeng Zhang,
- Abstract要約: TopoMeshは、GTと予測メッシュを、共有デュアルマーチングキューブ(DMC)トポロジフレームワークで統合した、スパースボクセルベースのVAEである。
我々のデコーダは同じDMCフォーマットでメッシュを出力し、予測とターゲットのメッシュが同じトポロジ構造を共有することを保証します。
大規模な実験により、TopoMeshは再建忠実度において既存のVAEを著しく上回っていることが示された。
- 参考スコア(独自算出の注目度): 44.632513151214084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The dominant paradigm for high-fidelity 3D generation relies on a VAE-Diffusion pipeline, where the VAE's reconstruction capability sets a firm upper bound on generation quality. A fundamental challenge limiting existing VAEs is the representation mismatch between ground-truth meshes and network predictions: GT meshes have arbitrary, variable topology, while VAEs typically predict fixed-structure implicit fields (\eg, SDF on regular grids). This inherent misalignment prevents establishing explicit mesh-level correspondences, forcing prior work to rely on indirect supervision signals such as SDF or rendering losses. Consequently, fine geometric details, particularly sharp features, are poorly preserved during reconstruction. To address this, we introduce TopoMesh, a sparse voxel-based VAE that unifies both GT and predicted meshes under a shared Dual Marching Cubes (DMC) topological framework. Specifically, we convert arbitrary input meshes into DMC-compliant representations via a remeshing algorithm that preserves sharp edges using an L$\infty$ distance metric. Our decoder outputs meshes in the same DMC format, ensuring that both predicted and target meshes share identical topological structures. This establishes explicit correspondences at the vertex and face level, allowing us to derive explicit mesh-level supervision signals for topology, vertex positions, and face orientations with clear gradients. Our sparse VAE architecture employs this unified framework and is trained with Teacher Forcing and progressive resolution training for stable and efficient convergence. Extensive experiments demonstrate that TopoMesh significantly outperforms existing VAEs in reconstruction fidelity, achieving superior preservation of sharp features and geometric details.
- Abstract(参考訳): 高忠実度3D生成の主流のパラダイムは、VAEの再構築能力が生成品質にしっかりと上限を置いているVAE拡散パイプラインに依存している。
GTメッシュは任意の可変トポロジを持ち、VAEは通常固定構造の暗黙的フィールド(通常のグリッド上のSDF)を予測します。
この固有のミスアライメントは、明確なメッシュレベルの対応を確立するのを防ぎ、事前の作業は、SDFやレンダリング損失のような間接的な監視信号に頼ることを余儀なくされる。
そのため、細かな幾何学的細部、特に鋭い特徴は再建の際には保存が不十分である。
そこで本稿では,GTと予測メッシュを結合した疎ボキセルベースのVAEであるTopoMeshについて,DMC(Dual Marching Cubes)トポロジカルフレームワークを用いて紹介する。
具体的には、任意の入力メッシュを、L$\infty$距離メートル法を用いてシャープエッジを保存するリメッシングアルゴリズムにより、DMC準拠の表現に変換する。
我々のデコーダは同じDMCフォーマットでメッシュを出力し、予測とターゲットのメッシュが同じトポロジ構造を共有することを保証します。
これにより、頂点と面レベルで明確な対応を確立し、トポロジ、頂点位置、面配向を明確な勾配で明確なメッシュレベルの監視信号を導出することができる。
我々のスパースVAEアーキテクチャは、この統一されたフレームワークを採用し、安定的で効率的な収束のための教師強制と進歩的解決訓練で訓練されている。
大規模な実験により、TopoMeshは既存のVAEよりも高い再現率を示し、鋭い特徴と幾何学的詳細の保存に優れていた。
関連論文リスト
- Shape-of-You: Fused Gromov-Wasserstein Optimal Transport for Semantic Correspondence in-the-Wild [7.4746628878102195]
Shape-of-Youは意味対応のための教師なし学習フレームワークである。
SPair-71kおよびAP-10kデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-03-12T07:22:03Z) - LATO: 3D Mesh Flow Matching with Structured TOpology Preserving LAtents [43.84310366771089]
LATOは、スケーラブルでフローマッチングに基づく明示的な3Dメッシュの合成を可能にする、新しいトポロジ保存潜在表現である。
生成モデリングでは、LATOは2段階のフローマッチングプロセスを採用し、最初は構造ボクセルを合成し、その後、ボクセルのトポロジーの特徴を精製する。
従来の等曲面/三角形に基づく拡散モデルや自己回帰生成アプローチと比較して、LATOは推論において高い効率を保ちながら、複雑な幾何学、よく形成されたトポロジーを持つメッシュを生成する。
論文 参考訳(メタデータ) (2026-03-06T15:09:25Z) - DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation [47.409626500688866]
本稿では,DINO Spherical Autoencoder(DINO-SAE)について述べる。
提案手法は, 既修のVFMと強いセマンティックアライメントを維持しつつ, 0.37 rFID と 26.2 dB PSNR に到達し, 最先端の再現性を実現する。
論文 参考訳(メタデータ) (2026-01-30T12:25:34Z) - Dense Semantic Matching with VGGT Prior [49.42199006453071]
本稿では,VGGTの本質的な強みを,初期の特徴段階を再利用し,後続の特徴段階を微調整し,双方向対応のための意味的頭部を追加することによって維持するアプローチを提案する。
提案手法は, 従来のベースラインよりも優れた幾何認識, 整合性, および多様体保存を実現する。
論文 参考訳(メタデータ) (2025-09-25T14:56:11Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - UGMAE: A Unified Framework for Graph Masked Autoencoders [67.75493040186859]
グラフマスク付きオートエンコーダのための統一フレームワークであるUGMAEを提案する。
まず,ノードの特異性を考慮した適応型特徴マスク生成器を開発した。
次に,階層型構造再構成と特徴再構成を併用し,総合的なグラフ情報を取得する。
論文 参考訳(メタデータ) (2024-02-12T19:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。