論文の概要: UniMesh: Unifying 3D Mesh Understanding and Generation
- arxiv url: http://arxiv.org/abs/2604.17472v1
- Date: Sun, 19 Apr 2026 14:53:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.542253
- Title: UniMesh: Unifying 3D Mesh Understanding and Generation
- Title(参考訳): UniMesh: 3Dメッシュの理解と生成の統合
- Authors: Peng Huang, Yifeng Chen, Zeyu Zhang, Hao Tang,
- Abstract要約: 一つのアーキテクチャ内で3D生成と理解を共同で学習する統合フレームワークUniMeshを提案する。
まず,拡散に基づく画像生成を暗黙の形状デコーダでブリッジし,クロスモデルインタフェースとして機能する新しいメッシュヘッドを提案する。
第2に、ユーザ主導のセマンティックメッシュ編集を可能にする反復推論の幾何学的インスタンス化であるChain of Mesh(CoM)を開発する。
第3に,3次元キャプションなどの高レベルタスクにおける障害の診断と修正を行うために,アクタ評価器を用いた自己反射機構を組み込んだ。
- 参考スコア(独自算出の注目度): 17.488670315445983
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in 3D vision have led to specialized models for either 3D understanding (e.g., shape classification, segmentation, reconstruction) or 3D generation (e.g., synthesis, completion, and editing). However, these tasks are often tackled in isolation, resulting in fragmented architectures and representations that hinder knowledge transfer and holistic scene modeling. To address these challenges, we propose UniMesh, a unified framework that jointly learns 3D generation and understanding within a single architecture. First, we introduce a novel Mesh Head that acts as a cross model interface, bridging diffusion based image generation with implicit shape decoders. Second, we develop Chain of Mesh (CoM), a geometric instantiation of iterative reasoning that enables user driven semantic mesh editing through a closed loop latent, prompting, and re generation cycle. Third, we incorporate a self reflection mechanism based on an Actor Evaluator Self reflection triad to diagnose and correct failures in high level tasks like 3D captioning. Experimental results demonstrate that UniMesh not only achieves competitive performance on standard benchmarks but also unlocks novel capabilities in iterative editing and mutual enhancement between generation and understanding. Code: https://github.com/AIGeeksGroup/UniMesh. Website: https://aigeeksgroup.github.io/UniMesh.
- Abstract(参考訳): 近年の3次元視覚の進歩は、3次元理解(例えば、形状分類、セグメンテーション、再構成)または3次元生成(例えば、合成、完成、編集)の特別なモデルに繋がった。
しかしながら、これらのタスクは独立して取り組まれることが多く、結果として、知識伝達や全体論的シーンモデリングを妨げる、断片化されたアーキテクチャや表現が生まれる。
これらの課題に対処するために、単一のアーキテクチャ内で3D生成と理解を共同で学習する統合フレームワークであるUniMeshを提案する。
まず,拡散に基づく画像生成を暗黙の形状デコーダでブリッジし,クロスモデルインタフェースとして機能する新しいメッシュヘッドを提案する。
第二にChain of Mesh(CoM)を開発した。これは反復推論の幾何学的インスタンス化であり、クローズドループ遅延、プロンプト、再生成サイクルによるユーザ駆動セマンティックメッシュの編集を可能にする。
第3に,3次元キャプションなどの高レベルタスクにおける障害の診断と修正を行うために,アクタ評価器を用いた自己反射機構を組み込んだ。
実験結果から、UniMeshは標準ベンチマーク上での競争性能を達成するだけでなく、反復的な編集や、生成と理解の相互強化における新たな能力も解放することが示された。
コード:https://github.com/AIGeeksGroup/UniMesh
ウェブサイト:https://aigeeksgroup.github.io/UniMesh
関連論文リスト
- PercHead: Perceptual Head Model for Single-Image 3D Head Reconstruction & Editing [51.56943889042673]
PercHeadは、シングルイメージの3Dヘッド再構成とセマンティック3D編集のための方法である。
単一の入力画像からビュー一貫性を持つ3Dヘッドを再構成するための統一ベースモデルを開発する。
軽量でインタラクティブなGUIを通して、直感的で強力な3D編集機能を強調します。
論文 参考訳(メタデータ) (2025-11-04T17:59:15Z) - UniLat3D: Geometry-Appearance Unified Latents for Single-Stage 3D Generation [98.40254523605581]
UniLat3Dは、単一の潜在空間における幾何学と外観を符号化する統一されたフレームワークである。
我々の重要な貢献は、高分解能スパース特徴をコンパクトな潜在表現に圧縮する幾何学的外観統一VAEである。
UniLat3Dは、1枚の画像から数秒で高品質な3Dアセットを生成する。
論文 参考訳(メタデータ) (2025-09-29T17:21:23Z) - UniUGG: Unified 3D Understanding and Generation via Geometric-Semantic Encoding [65.60549881706959]
3Dモダリティのための最初の統一的理解・生成フレームワークUniUGGを紹介する。
本フレームワークでは,LLMを用いて文や3次元表現の理解とデコードを行う。
遅延拡散モデルを利用して高品質な3次元表現を生成する空間デコーダを提案する。
論文 参考訳(メタデータ) (2025-08-16T07:27:31Z) - Gaussian Grouping: Segment and Edit Anything in 3D Scenes [65.49196142146292]
ガウシアン・グルーピング(ガウシアン・グルーピング)はガウシアン・スプラッティングを拡張して,オープンワールドの3Dシーンで何かを共同で再構築・分割する。
暗黙のNeRF表現と比較すると,グループ化された3次元ガウシアンは,高画質,微粒度,高効率で,あらゆるものを3次元で再構成,分割,編集することができる。
論文 参考訳(メタデータ) (2023-12-01T17:09:31Z) - Unsupervised Style-based Explicit 3D Face Reconstruction from Single
Image [10.1205208477163]
本研究では,Unsupervised 2D to Explicit 3D Style Transferを解くための一般的な逆学習フレームワークを提案する。
具体的には、Wuらによる教師なし明示的な3D再構成ネットワークと、StarGAN-v2というジェネレーティブ・アドバイザリ・ネットワーク(GAN)の2つのアーキテクチャを統合する。
提案手法は,DepthNetを3次元再構成で,Pix2NeRFを条件付き転送で,よく確立されたソリューションよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-24T21:25:06Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。