論文の概要: MOC-3D: Manifold-Order Consistency for Text-to-3D Generation
- arxiv url: http://arxiv.org/abs/2605.01743v1
- Date: Sun, 03 May 2026 06:45:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.919231
- Title: MOC-3D: Manifold-Order Consistency for Text-to-3D Generation
- Title(参考訳): MOC-3D:テキストから3D生成のためのマニフォールド整合性
- Authors: Chenyang Fan, Junshi Cheng, Wen Yang, Zihong Li, Wenfeng Zhang, Wei Hu, Yi Zhang, Pan Zeng,
- Abstract要約: MOC-3Dは、幾何多様体とセマンティックビューオーダー整合性に基づくテキストから3D生成法である。
本手法では,セマンティック・ビュー・オーダー制約モジュールとマニフォールド・ベースの特徴継続モジュールを組み込む。
- 参考スコア(独自算出の注目度): 23.728859313442385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the burgeoning development of fields such as the Metaverse, Virtual Reality (VR), and Digital Twins, text-to-3D generation has emerged as a research hotspot in both academia and industry. Currently, optimization methods based on Score Distillation Sampling (SDS) utilizing 2D diffusion priors have become the mainstream technological paradigm in this field. However, due to the view bias of 2D priors and the mode-seeking ambiguity combined with gradient noise induced by high Classifier-Free Guidance (CFG), these methods still suffer from macro-topological inconsistency (e.g., the Janus problem) and micro-geometric discontinuity. To address these challenges, we propose MOC-3D, a text-to-3D generation method based on geometric manifold and semantic view-order consistency. Built upon the ScaleDreamer framework, our method incorporates a Semantic View-Order Constraint Module and a Manifold-based Feature Continuity Module. The former aims to rectify macro-topological inconsistency, while the latter focuses on eliminating micro-geometric discontinuity. Specifically, the Semantic View-Order Constraint Module leverages the prior knowledge of CLIP to impose a Monotonicity Rank Constraint on semantic score representations across different views, thereby providing effective guidance for the global topological structure of 3D objects. Meanwhile, the Manifold-based Feature Continuity Module employs the Riemannian Metric on the Symmetric Positive Definite (SPD) manifold. By measuring the distance of feature statistical distributions in the Riemannian space, it promotes the smooth evolution and continuity of micro-textures across multi-views in a statistical sense. Under the macro-micro synergistic optimization of these two modules, our model can simultaneously improve macro-structural consistency and micro-detail continuity.
- Abstract(参考訳): メタバース(Metaverse)、バーチャルリアリティ(Virtual Reality)、デジタルツインズ(Digital Twins)といった分野の急成長に伴い、テキスト・ツー・3D世代は学術・産業ともに研究ホットスポットとなっている。
現在,2次元拡散プリミティブを用いたスコア蒸留サンプリング(SDS)に基づく最適化手法が,この分野における主要な技術パラダイムとなっている。
しかし,2次元先行の視線バイアスやモード探索の曖昧さと高い分類自由誘導(CFG)による勾配雑音が組み合わさって,これらの手法はマクロトポロジ的不整合(例えばヤヌス問題)と微小幾何学的不連続性に悩まされている。
これらの課題に対処するために,幾何多様体とセマンティックビューオーダー整合性に基づくテキストから3D生成法MOC-3Dを提案する。
ScaleDreamerフレームワークを基盤として,Semantic View-Order Constraint ModuleとManifoldベースのFeature Continuity Moduleを組み込んだ。
前者はマクロトポロジ的不整合の是正を目的としており、後者は微小幾何学的不連続性を排除することに焦点を当てている。
具体的には、セマンティックビューオーダ制約モジュールは、CLIPの以前の知識を活用して、異なるビューのセマンティックスコア表現にモノトニティランク制約を課し、3Dオブジェクトのグローバルなトポロジ構造に対する効果的なガイダンスを提供する。
一方、多様体に基づく特徴連続加群は、対称正定性(SPD)多様体上のリーマン計量(英語版)(Riemannian Metric)を用いる。
リーマン空間における特徴統計分布の距離を測定することにより、統計的な意味での多視点にわたる微小テクスチャの滑らかな進化と連続性を促進する。
これら2つのモジュールのマクロ-ミクロ相乗的最適化の下で、我々のモデルはマクロ構造整合性とマイクロ詳細連続性を同時に改善することができる。
関連論文リスト
- Attention-Guided Flow-Matching for Sparse 3D Geological Generation [7.734651455015875]
3D-GeoFlowは、スパースマルチモーダルな地質モデリングに適した最初のアテンションガイド型連続フローマッチングフレームワークである。
離散カテゴリー生成をシミュレーションのない連続ベクトル場回帰として再構成することにより、安定な決定論的最適輸送経路を確立する。
この枠組みを検証するため,2200件の手続き的に生成された3次元地質事例からなる大規模マルチモーダルデータセットをキュレートした。
論文 参考訳(メタデータ) (2026-04-07T07:02:53Z) - Walking Further: Semantic-aware Multimodal Gait Recognition Under Long-Range Conditions [27.59550056623308]
We present textbfLRGait, the first LiDAR-Camera multimodal benchmark for robust long-range gait recognition。
また,長距離マルチモーダル歩行認識に適したエンドツーエンドフレームワークである textbfEMGaitNet を提案する。
論文 参考訳(メタデータ) (2026-03-15T02:32:27Z) - Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing [59.12032628787018]
バーチャルリアリティー(VR)における人中心視覚モデリングには3次元メッシュサリエンシ基底真理が不可欠である
現在のVRアイトラッキングパイプラインは、単一線サンプリングとユークリッドのスムース化に依存しており、テクスチャの注意を喚起し、ギャップをまたいだ信号の漏洩を引き起こす。
本稿では,これらの制約に対処する頑健な枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-06T05:20:12Z) - PRGCN: A Graph Memory Network for Cross-Sequence Pattern Reuse in 3D Human Pose Estimation [18.771349697842947]
本稿では、パターン検索と適応の問題としてポーズ推定を形式化する新しいフレームワークであるパターン再利用グラフ変換ネットワーク(PRGCN)を紹介する。
PRGCNのコアとなるグラフメモリバンクは、リレーショナルグラフとして符号化された一連のコンパクトなポーズプロトタイプを学習し、格納する。
PRGCNは,それぞれ37.1mm,13.4mmのMPJPEを達成し,クロスドメインの一般化能力の向上を図っている。
論文 参考訳(メタデータ) (2025-10-22T11:12:07Z) - Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [59.17489431187807]
本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。
本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文 参考訳(メタデータ) (2025-09-18T13:45:08Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [9.411542547451193]
本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文 参考訳(メタデータ) (2025-06-17T07:04:07Z) - MS-Occ: Multi-Stage LiDAR-Camera Fusion for 3D Semantic Occupancy Prediction [15.656771219382076]
MS-Occは、新しいマルチステージLiDARカメラ融合フレームワークである。
これはLiDARの幾何学的忠実度とカメラベースのセマンティックリッチネスを統合する。
実験の結果、MS-Occは連合(IoU)を32.1%、平均IoU(mIoU)を25.3%で割った。
論文 参考訳(メタデータ) (2025-04-22T13:33:26Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。