論文の概要: ALTO: Alternating Latent Topologies for Implicit 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2212.04096v1
- Date: Thu, 8 Dec 2022 06:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 15:32:02.111046
- Title: ALTO: Alternating Latent Topologies for Implicit 3D Reconstruction
- Title(参考訳): ALTO : インシシット3次元再構成のための代替的潜伏トポロジー
- Authors: Zhen Wang, Shijie Zhou, Jeong Joon Park, Despoina Paschalidou, Suya
You, Gordon Wetzstein, Leonidas Guibas, Achuta Kadambi
- Abstract要約: この研究は、雑音の多い点雲から暗黙の3次元表面を高忠実に再構成するための交互潜在トポロジー(ALTO)を導入する。
一つの思考の流派は、各点(点潜在点)の潜在ベクトルを符号化することである。
もう一つの考え方は、ラテントを格子(格子状ラテント)に射影させることであり、これはボクセル格子または三面体格子である。
- 参考スコア(独自算出の注目度): 45.45821428022957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces alternating latent topologies (ALTO) for high-fidelity
reconstruction of implicit 3D surfaces from noisy point clouds. Previous work
identifies that the spatial arrangement of latent encodings is important to
recover detail. One school of thought is to encode a latent vector for each
point (point latents). Another school of thought is to project point latents
into a grid (grid latents) which could be a voxel grid or triplane grid. Each
school of thought has tradeoffs. Grid latents are coarse and lose
high-frequency detail. In contrast, point latents preserve detail. However,
point latents are more difficult to decode into a surface, and quality and
runtime suffer. In this paper, we propose ALTO to sequentially alternate
between geometric representations, before converging to an easy-to-decode
latent. We find that this preserves spatial expressiveness and makes decoding
lightweight. We validate ALTO on implicit 3D recovery and observe not only a
performance improvement over the state-of-the-art, but a runtime improvement of
3-10$\times$. Project website at https://visual.ee.ucla.edu/alto.htm/.
- Abstract(参考訳): 本研究は,うるさい点雲から暗黙の3次元表面を高忠実に再構成するための交互潜在位相 (alto) を導入する。
先行研究は、詳細を復元するために潜伏符号化の空間的配置が重要であることを確認している。
一つの考え方は、各点(点)に対する潜在ベクトルを符号化することである。
もうひとつの考え方は、ボクセルグリッドや三平面グリッドである格子(格子潜入体)に点潜入体を投影することである。
各学派にはトレードオフがある。
グリッドラテントは粗く、高周波の詳細を失う。
対照的に、ポイントラテントは詳細を保存する。
しかし、ポイントラテントは、表面へのデコードがより難しく、品質とランタイムが苦しむ。
本稿では,幾何表現間の交互に交互にaltoを提案する。
これは空間的表現性を保ち、復号化を軽量にする。
我々はALTOを暗黙の3Dリカバリで検証し、最先端技術に対するパフォーマンス改善だけでなく、ランタイムの改善を310$\times$で観測する。
プロジェクトウェブサイト - https://visual.ee.ucla.edu/alto.htm/
関連論文リスト
- GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions [22.077366472693395]
単一ビューコレクションから3次元形状と画像を合成するための新しい生成手法を提案する。
ニューラルラディアンス場を用いたボリュームレンダリングを用いることで、生成した幾何学はノイズが多く、制約がないという重要な制限を継承する。
エンド・ツー・エンドで訓練された新しいSDFベースの3D生成モデルであるGeoGenを提案する。
論文 参考訳(メタデータ) (2024-06-06T17:00:10Z) - GSDF: 3DGS Meets SDF for Improved Rendering and Reconstruction [20.232177350064735]
フレキシブルで効率的な3次元ガウス分割表現とニューラルサイン付き距離場(SDF)の利点を組み合わせた新しいデュアルブランチアーキテクチャを提案する。
我々のデザインがより正確で詳細な表面再構成の可能性を解き放つ多様なシーンを示す。
論文 参考訳(メタデータ) (2024-03-25T17:22:11Z) - GridPull: Towards Scalability in Learning Implicit Representations from
3D Point Clouds [60.27217859189727]
大規模クラウドから暗黙の表現を学習する効率を改善するため,GridPullを提案する。
我々の斬新さは、ニューラルネットワークを使わずにグリッド上に定義された離散距離場の高速な推論にある。
我々は、一様格子を用いて高速グリッド探索を行い、サンプルクエリをローカライズし、木構造内の表面点を整理し、表面への距離の計算を高速化する。
論文 参考訳(メタデータ) (2023-08-25T04:52:52Z) - Self-Supervised Geometry-Aware Encoder for Style-Based 3D GAN Inversion [115.82306502822412]
StyleGANは、画像インバージョンと潜時編集による2次元顔再構成とセマンティック編集において大きな進歩を遂げている。
対応する汎用的な3D GANインバージョンフレームワークがまだ欠けており、3D顔再構成とセマンティック編集の応用が制限されている。
本研究では,その3次元形状と詳細なテクスチャを忠実に復元するために,単一の顔画像から潜伏コードを予測する3D GAN逆変換の課題について検討する。
論文 参考訳(メタデータ) (2022-12-14T18:49:50Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - POCO: Point Convolution for Surface Reconstruction [92.22371813519003]
入射ニューラルネットワークは点雲からの表面再構成に成功している。
それらの多くは、オブジェクトやシーン全体を1つの潜伏ベクトルにエンコードするときにスケーラビリティの問題に直面します。
本稿では,各入力点における点雲畳み込みと潜在ベクトルの計算を提案する。
論文 参考訳(メタデータ) (2022-01-05T21:26:18Z) - Topologically Consistent Multi-View Face Inference Using Volumetric
Sampling [25.001398662643986]
ToFuは、幾何推論フレームワークで、アイデンティティと式をまたいだトポロジ的に一貫したメッシュを生成することができる。
新たなプログレッシブメッシュ生成ネットワークは、顔のトポロジ的構造を特徴量に埋め込む。
これらの高品質な資産は、アバターの作成、アニメーション、物理的にベースとしたスキンレンダリングのためのプロダクションスタジオで容易に利用することができる。
論文 参考訳(メタデータ) (2021-10-06T17:55:08Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。