論文の概要: SymTRELLIS: Symmetry-Enforced Voxel Latents for 3D Generation
- arxiv url: http://arxiv.org/abs/2606.04108v1
- Date: Tue, 02 Jun 2026 18:11:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.313207
- Title: SymTRELLIS: Symmetry-Enforced Voxel Latents for 3D Generation
- Title(参考訳): SymTRELLIS:Symmetry-Enforceed Voxel Latents for 3D Generation (特集 バイオサイバネティックスとバイオサイバネティックス)
- Authors: Guangda Ji, Qimin Chen, Qinchan Li, Mingrui Zhao, Kai Wang, Hao Zhang,
- Abstract要約: フローベースTRELLIS.2の3次元生成において任意の有限点群対称性を強制する手法であるSymTRELLISを提案する。
266の厳密な対称オブジェクトのキュレートされたベンチマークでは、SymTRELLISはTRELLIS.2、Hunyuan3D-2.1、TripoSGと比較して、すべての対称性エラーメトリクスを著しく削減している。
- 参考スコア(独自算出の注目度): 10.616258272621836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-view 3D generative models have achieved impressive visual quality, yet they are not designed to satisfy structural or functional requirements, and in practice, often fall short. Symmetry is one such requirement: violations, even subtle ones, on symmetry can render a model physically unusable. We present SymTRELLIS, a method that enforces arbitrary finite point group symmetries (rotational, reflectional, and polyhedral) during the flow-based 3D generation of TRELLIS.2, without retraining the underlying VAE or flow model. Our key idea is to approximate the latent-space action of spatial transformations as a learned linear operator on voxel latents, implemented as a lightweight spatial-transform latent mapper trained on generic, non-symmetric 3D data. At generation time, we enforce symmetry by averaging predicted flow velocities across all symmetry-equivalent transformations at each ODE step, a process we call velocity symmetrization. The symmetry specification can be estimated automatically from an initial TRELLIS.2 generation or supplied by the user, enabling deliberate fold manipulation beyond what the input image suggests. On a curated benchmark of 266 strictly symmetric objects spanning 2- to 20-fold rotations and polyhedral symmetry groups, SymTRELLIS substantially reduces all symmetry error metrics compared to TRELLIS.2, Hunyuan3D-2.1, and TripoSG, while maintaining reconstruction accuracy comparable to the base model.
- Abstract(参考訳): シングルビュー3D生成モデルは目覚ましい視覚的品質を達成したが、構造的あるいは機能的な要求を満たすように設計されていない。
対称性はそのような要件の1つであり、対称性上の違反、微妙なものでさえ、物理的に使用不可能なモデルをレンダリングすることができる。
本研究では,フローベースTRELLIS.2の3次元生成における任意の有限点群対称性(回転,反射,多面体)を,基礎となるVAEやフローモデルを再学習することなく適用する手法であるSymTRELLISを提案する。
我々のキーとなる考え方は、一般的な非対称な3次元データに基づいて訓練された軽量な空間変換潜時マッパーとして実装された、ボクセル潜時における学習線形作用素としての空間変換の潜時動作を近似することである。
生成時に、各ODEステップにおけるすべての対称性等価変換における予測フロー速度を平均化することで対称性を強制する。
対称性仕様は、初期TRELLIS.2世代から自動的に推定したり、ユーザから供給されたりすることができ、入力画像が示唆する以上の故意の折り畳み操作を可能にする。
266個の厳密な対称オブジェクトと多面体対称群を対象とする266個のベンチマークにおいて、SymTRELLISはTRELLIS.2、Hunyuan3D-2.1、TripoSGと比較して、すべての対称性エラーメトリクスを大幅に削減し、ベースモデルに匹敵する再現精度を維持した。
関連論文リスト
- Planar Symmetric Pattern Generation [40.32465897894085]
任意の平面群に対する対称性の枠組みを提案する。
我々の手法は連続性を保ちながら任意の2次元連続表現を対称表現に変換する。
論文 参考訳(メタデータ) (2026-06-01T11:01:48Z) - Symmetry-Compatible Principle for Optimizer Design: Embeddings, LM Heads, SwiGLU MLPs, and MoE Routers [3.433766572511366]
深層学習の実践において、目覚ましい幾何学的格差は長く続いている。
勾配更新規則は、対応する重みブロックに作用するパラメータ群の下で同値であるべきである。
論文 参考訳(メタデータ) (2026-05-18T09:17:26Z) - Aligning Network Equivariance with Data Symmetry: A Theoretical Framework and Adaptive Approach for Image Restoration [71.51826063983434]
画像復元は本質的に逆問題である。
非厳密対称性を制約として、復元逆問題を定式化する。
最適復元演算子の等値誤差はデータ対称性誤差と離散化メッシュサイズによって厳密に制限されていることを示す。
論文 参考訳(メタデータ) (2026-05-13T16:22:19Z) - SymDrift: One-Shot Generative Modeling under Symmetries [19.741742157466888]
等変生成器は、対称性化された対象分布から得られるものと同じドリフト場を一般的に生成しないため、ドリフトモデルは対称性に固有の課題に直面していることを示す。
i) 最適アライメントに基づく座標空間における対称性付きドリフト、(ii) 構成による対称性の曖昧さを取り除く$G$不変な埋め込みである。
ワンショット推論を有効にすることで、SymDriftは計算オーバーヘッドを既存のベースラインと比較して最大40$times$に削減する。
論文 参考訳(メタデータ) (2026-05-07T12:38:44Z) - Symmetry-Reduced Physics-Informed Learning of Tensegrity Dynamics [33.52984112921709]
多くの既存の物理インフォームドニューラルネットワーク(PINN)アプローチは、固有の幾何学的対称性を明示的に活用していない。
本稿では,群理論に基づく対称性を解表現とニューラルネットワークアーキテクチャの両方に直接組み込む,対称性を再現した物理インフォームドニューラルネットワーク(SymPINN)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-18T15:23:23Z) - Generalized Linear Mode Connectivity for Transformers [87.32299363530996]
驚くべき現象はリニアモード接続(LMC)であり、独立に訓練されたモデルを低損失またはゼロ損失の経路で接続することができる。
以前の研究は主に置換によるニューロンの並べ替えに焦点を合わせてきたが、そのようなアプローチは範囲に限られている。
我々は、4つの対称性クラス(置換、半置換、変換、一般可逆写像)をキャプチャする統一的なフレームワークを導入する。
この一般化により、独立に訓練された視覚変換器とGPT-2モデルの間の低障壁とゼロバリア線形経路の発見が可能となった。
論文 参考訳(メタデータ) (2025-06-28T01:46:36Z) - RECON: Robust symmetry discovery via Explicit Canonical Orientation Normalization [26.386588932734345]
簡単な右乗算によって任意の正準を補正するクラス目的の $textitcanonical orientation normalization$ である RECON を導入する。
2次元画像ベンチマークの結果を実証し、初めて3次元グループに対称性の発見を拡張した。
論文 参考訳(メタデータ) (2025-05-19T16:10:23Z) - Enhancing lattice kinetic schemes for fluid dynamics with Lattice-Equivariant Neural Networks [79.16635054977068]
我々はLattice-Equivariant Neural Networks (LENNs)と呼ばれる新しい同変ニューラルネットワークのクラスを提案する。
我々の手法は、ニューラルネットワークに基づく代理モデルLattice Boltzmann衝突作用素の学習を目的とした、最近導入されたフレームワーク内で開発されている。
本研究は,実世界のシミュレーションにおける機械学習強化Lattice Boltzmann CFDの実用化に向けて展開する。
論文 参考訳(メタデータ) (2024-05-22T17:23:15Z) - Learning Layer-wise Equivariances Automatically using Gradients [66.81218780702125]
畳み込みは等価対称性をニューラルネットワークにエンコードし、より優れた一般化性能をもたらす。
対称性は、ネットワークが表現できる機能、事前に指定する必要、適応できない機能に対して、固定されたハード制約を提供する。
私たちのゴールは、勾配を使ってデータから自動的に学習できるフレキシブル対称性の制約を可能にすることです。
論文 参考訳(メタデータ) (2023-10-09T20:22:43Z) - Oracle-Preserving Latent Flows [58.720142291102135]
我々はラベル付きデータセット全体にわたって複数の非自明な連続対称性を同時に発見するための方法論を開発する。
対称性変換と対応するジェネレータは、特別に構築された損失関数で訓練された完全連結ニューラルネットワークでモデル化される。
この研究における2つの新しい要素は、縮小次元の潜在空間の使用と、高次元のオラクルに関して不変な変換への一般化である。
論文 参考訳(メタデータ) (2023-02-02T00:13:32Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。