論文の概要: ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points
- arxiv url: http://arxiv.org/abs/2503.02745v2
- Date: Wed, 05 Mar 2025 04:49:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 12:09:32.279863
- Title: ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points
- Title(参考訳): ArcPro: スパースポイントの構造的3次元抽象化のためのアーキテクチャプログラム
- Authors: Qirui Huang, Runze Zhang, Kangjun Liu, Minglun Gong, Hao Zhang, Hui Huang,
- Abstract要約: ArcProは、ポイントクラウドから構造化された3D抽象化を復元するアーキテクチャプログラム上に構築された学習フレームワークである。
我々は,非構造化点クラウドからアーキテクチャプログラムへのマッピングを確立するために,ポイントプログラムペア上でエンコーダ・デコーダを訓練する。
提案手法による推論は非常に効率的で, 信頼性が高く, 忠実な3次元抽象化を実現する。
- 参考スコア(独自算出の注目度): 21.052495894521872
- License:
- Abstract: We introduce ArcPro, a novel learning framework built on architectural programs to recover structured 3D abstractions from highly sparse and low-quality point clouds. Specifically, we design a domain-specific language (DSL) to hierarchically represent building structures as a program, which can be efficiently converted into a mesh. We bridge feedforward and inverse procedural modeling by using a feedforward process for training data synthesis, allowing the network to make reverse predictions. We train an encoder-decoder on the points-program pairs to establish a mapping from unstructured point clouds to architectural programs, where a 3D convolutional encoder extracts point cloud features and a transformer decoder autoregressively predicts the programs in a tokenized form. Inference by our method is highly efficient and produces plausible and faithful 3D abstractions. Comprehensive experiments demonstrate that ArcPro outperforms both traditional architectural proxy reconstruction and learning-based abstraction methods. We further explore its potential to work with multi-view image and natural language inputs.
- Abstract(参考訳): アーキテクチャプログラム上に構築された新しい学習フレームワークであるArcProを導入し、高度にスパースで低品質なポイントクラウドから構造化された3D抽象化を復元する。
具体的には、ドメイン固有言語(DSL)を設計し、階層的に構築構造をプログラムとして表現し、効率的にメッシュに変換する。
データ合成のトレーニングにフィードフォワードプロセスを用いることで、フィードフォワードおよび逆プロシージャモデリングをブリッジし、ネットワークが逆予測を行えるようにする。
そこで3D畳み込みエンコーダはポイントクラウドの特徴を抽出し,トランスフォーマーデコーダはトークン化形式でプログラムを自動回帰予測する。
提案手法による推論は非常に効率的で, 信頼性が高く, 忠実な3次元抽象化を実現する。
包括的な実験により、ArcProは従来のアーキテクチャプロキシの再構築と学習ベースの抽象化の両方よりも優れています。
さらに、マルチビュー画像や自然言語入力を扱う可能性についても検討する。
関連論文リスト
- FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [93.6881532277553]
FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文 参考訳(メタデータ) (2025-02-17T18:54:05Z) - Synthesizing 3D Abstractions by Inverting Procedural Buildings with Transformers [2.199128905898291]
手続きモデルを逆転させることで,建物を抽象化する。
提案手法は, 形状, 構造, 構造的に一貫した塗装の精度を向上する。
論文 参考訳(メタデータ) (2025-01-28T16:09:34Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - PyTorchGeoNodes: Enabling Differentiable Shape Programs for 3D Shape Reconstruction [27.98261111833689]
PyTorchGeoNodesは,解釈可能な形状プログラムを用いて画像から3Dオブジェクトを再構成する,識別可能なモジュールである。
実験では,ScanNetデータセットの3次元オブジェクトの再構成にアルゴリズムを適用し,CADモデル検索による再構成に対して評価を行った。
論文 参考訳(メタデータ) (2024-04-16T14:43:33Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [71.91424164693422]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - ROAD: Learning an Implicit Recursive Octree Auto-Decoder to Efficiently
Encode 3D Shapes [32.267066838654834]
複雑な3次元形状の大規模データセットを効率よく正確に符号化する新しい暗黙表現を提案する。
暗黙的再帰的Octree Auto-Decoder (ROAD) は階層的に構造化された潜在空間を学習し、圧縮比99%以上で最先端の復元結果を実現する。
論文 参考訳(メタデータ) (2022-12-12T19:09:47Z) - Learning Local Displacements for Point Cloud Completion [93.54286830844134]
本稿では,3次元点雲として表現された部分的スキャンからオブジェクトとセマンティックシーンを補完する手法を提案する。
アーキテクチャはエンコーダ-デコーダ構造内で連続的に使用される3つの新しいレイヤに依存している。
オブジェクトと屋内の両方のシーン完了タスクにおけるアーキテクチャの評価を行い、最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-03-30T18:31:37Z) - Translational Symmetry-Aware Facade Parsing for 3D Building
Reconstruction [11.263458202880038]
本稿では,深部ニューラルネットワーク改善のための新しい翻訳対称性に基づくアプローチを提案する。
本研究では,単一段ネットワークにおけるアンカーフリー検出を融合させる新しい手法を提案する。
我々はBlenderのような市販のレンダリングエンジンを使用して、手続きモデルを用いて現実的な高品質な3Dモデルを再構築する。
論文 参考訳(メタデータ) (2021-06-02T03:10:51Z) - Convolutional Occupancy Networks [88.48287716452002]
本稿では,オブジェクトと3Dシーンの詳細な再構築のための,より柔軟な暗黙的表現である畳み込み機能ネットワークを提案する。
畳み込みエンコーダと暗黙の占有デコーダを組み合わせることで、帰納的バイアスが組み込まれ、3次元空間における構造的推論が可能となる。
実験により,本手法は単一物体の微細な3次元再構成,大規模屋内シーンへのスケール,合成データから実データへの一般化を可能にした。
論文 参考訳(メタデータ) (2020-03-10T10:17:07Z) - Unsupervised Learning of Intrinsic Structural Representation Points [50.92621061405056]
3次元形状の学習構造は、コンピュータグラフィックスと幾何学処理の分野における根本的な問題である。
本稿では,3次元構造点の形で新しい構造表現を学習するための簡易かつ解釈不能な手法を提案する。
論文 参考訳(メタデータ) (2020-03-03T17:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。