論文の概要: HPR3D: Hierarchical Proxy Representation for High-Fidelity 3D Reconstruction and Controllable Editing
- arxiv url: http://arxiv.org/abs/2507.11971v1
- Date: Wed, 16 Jul 2025 07:09:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.268199
- Title: HPR3D: Hierarchical Proxy Representation for High-Fidelity 3D Reconstruction and Controllable Editing
- Title(参考訳): HPR3D:高忠実度3次元再構成と制御可能な編集のための階層的プロキシ表現
- Authors: Tielong Wang, Yuxuan Xiong, Jinfan Liu, Zhifan Zhang, Ye Chen, Yue Shi, Bingbing Ni,
- Abstract要約: メッシュ、ボクセル、ポイントクラウド、NeRFベースのニューラル暗黙のフィールドといった3D表現には、大きな制限がある。
本稿では,新しい3次元階層型プロキシノード表現を提案する。
提案手法は, 表現効率, 高忠実度レンダリング品質, 編集性に優れていた。
- 参考スコア(独自算出の注目度): 33.554101922316946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current 3D representations like meshes, voxels, point clouds, and NeRF-based neural implicit fields exhibit significant limitations: they are often task-specific, lacking universal applicability across reconstruction, generation, editing, and driving. While meshes offer high precision, their dense vertex data complicates editing; NeRFs deliver excellent rendering but suffer from structural ambiguity, hindering animation and manipulation; all representations inherently struggle with the trade-off between data complexity and fidelity. To overcome these issues, we introduce a novel 3D Hierarchical Proxy Node representation. Its core innovation lies in representing an object's shape and texture via a sparse set of hierarchically organized (tree-structured) proxy nodes distributed on its surface and interior. Each node stores local shape and texture information (implicitly encoded by a small MLP) within its neighborhood. Querying any 3D coordinate's properties involves efficient neural interpolation and lightweight decoding from relevant nearby and parent nodes. This framework yields a highly compact representation where nodes align with local semantics, enabling direct drag-and-edit manipulation, and offers scalable quality-complexity control. Extensive experiments across 3D reconstruction and editing demonstrate our method's expressive efficiency, high-fidelity rendering quality, and superior editability.
- Abstract(参考訳): メッシュ、ボクセル、ポイントクラウド、NeRFベースのニューラル暗黙のフィールドといった現在の3D表現は、しばしばタスク固有であり、再構築、生成、編集、駆動に普遍的な適用性を欠いている。
メッシュは高い精度を提供するが、その密度の高い頂点データは編集を複雑にする; NeRFは優れたレンダリングを提供するが、構造的な曖昧さに悩まされ、アニメーションと操作を妨げる;すべての表現は本質的に、データの複雑さとフィデリティの間のトレードオフに苦しむ。
これらの問題を克服するために,我々は新しい3D階層型プロキシノード表現を導入する。
その中心となるイノベーションは、オブジェクトの形状とテクスチャを、その表面と内部に分散された階層的に整理された(ツリー構造化された)プロキシノードのスパースセットで表現することにある。
各ノードは、その周辺に局所的な形状とテクスチャ情報(単純に小さなMLPで符号化されている)を格納する。
任意の3D座標の性質を問うには、効率的な神経補間と、関連する近接ノードと親ノードからの軽量デコードが含まれる。
このフレームワークは、ノードが局所的なセマンティクスと整合し、直接ドラッグ・アンド・エディット操作を可能にし、スケーラブルな品質・複雑さ制御を提供する、非常にコンパクトな表現を提供する。
3次元再構成と編集にまたがる広範囲な実験により,本手法の表現効率,高忠実度レンダリング品質,編集性の向上が示された。
関連論文リスト
- Self-Attention Based Multi-Scale Graph Auto-Encoder Network of 3D Meshes [1.573038298640368]
3D Geometric Mesh Network(3DGeoMeshNet)は、異方性畳み込み層を用いて空間領域内でグローバルな特徴とローカルな特徴を直接学習する新しいGCNベースのフレームワークである。
我々のアーキテクチャはマルチスケールエンコーダ・デコーダ構造を特徴とし、大域的および局所的な経路は大規模な幾何学的構造と微細な局所的詳細の両方を捉えている。
論文 参考訳(メタデータ) (2025-07-07T07:36:03Z) - PrITTI: Primitive-based Generation of Controllable and Editable 3D Semantic Scenes [30.417675568919552]
大規模な3Dセマンティックシーン生成は、主にボクセルに基づく表現に依存している。
プリミティブは、操作や構成が容易なコンパクトで粗い3D構造を使って、セマンティックなエンティティを表現する。
PrITTIは遅延拡散に基づくフレームワークで、プリミティブを作曲、制御可能、編集可能なシーンレイアウトを生成するための基本的な要素として活用する。
論文 参考訳(メタデータ) (2025-06-23T20:47:18Z) - SplatMesh: Interactive 3D Segmentation and Editing Using Mesh-Based Gaussian Splatting [86.50200613220674]
3Dベースのインタラクティブ編集における重要な課題は、与えられたメモリ制約の下で様々な修正と高品質なビュー合成のバランスをとる効率的な表現がないことである。
SplatMeshは,3次元ガウススプラッティングと事前計算メッシュを統合した,対話型3Dセグメンテーション・編集アルゴリズムである。
単純化されたメッシュのセグメンテーションと編集により、ガウススプレートの編集も効果的に行えます。
論文 参考訳(メタデータ) (2023-12-26T02:50:42Z) - Neural Impostor: Editing Neural Radiance Fields with Explicit Shape
Manipulation [49.852533321916844]
マルチグリッドの暗黙の場とともに、明示的な四面体メッシュを組み込んだハイブリッド表現であるNeural Impostorを導入する。
我々のフレームワークは、多グリッドのバリ中心座標符号化を利用して、暗黙のフィールドの明示的な形状操作と幾何的編集を橋渡しする。
合成オブジェクトと実際のキャプチャデータの両方を編集するなど、多様な例や実験を通して、システムの堅牢性と適応性を示す。
論文 参考訳(メタデータ) (2023-10-09T04:07:00Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - Convolutional Occupancy Networks [88.48287716452002]
本稿では,オブジェクトと3Dシーンの詳細な再構築のための,より柔軟な暗黙的表現である畳み込み機能ネットワークを提案する。
畳み込みエンコーダと暗黙の占有デコーダを組み合わせることで、帰納的バイアスが組み込まれ、3次元空間における構造的推論が可能となる。
実験により,本手法は単一物体の微細な3次元再構成,大規模屋内シーンへのスケール,合成データから実データへの一般化を可能にした。
論文 参考訳(メタデータ) (2020-03-10T10:17:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。