論文の概要: POC-SLT: Partial Object Completion with SDF Latent Transformers
- arxiv url: http://arxiv.org/abs/2411.05419v1
- Date: Fri, 08 Nov 2024 09:13:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:54:29.731492
- Title: POC-SLT: Partial Object Completion with SDF Latent Transformers
- Title(参考訳): POC-SLT: SDF遅延変換器による部分的オブジェクト補完
- Authors: Faezeh Zakeri, Raphael Braun, Lukas Ruppert, Henrik P. A. Lensch,
- Abstract要約: 3次元幾何形状完成ヒンジは、表現学習と幾何データの深い理解に基づく。
符号付き距離場(SDF)を表す潜在空間で動作する変圧器を提案する。
モノリシックなボリュームの代わりに、オブジェクトのSDFは小さな高解像度のパッチに分割され、遅延コードのシーケンスにつながる。
- 参考スコア(独自算出の注目度): 1.5999407512883512
- License:
- Abstract: 3D geometric shape completion hinges on representation learning and a deep understanding of geometric data. Without profound insights into the three-dimensional nature of the data, this task remains unattainable. Our work addresses this challenge of 3D shape completion given partial observations by proposing a transformer operating on the latent space representing Signed Distance Fields (SDFs). Instead of a monolithic volume, the SDF of an object is partitioned into smaller high-resolution patches leading to a sequence of latent codes. The approach relies on a smooth latent space encoding learned via a variational autoencoder (VAE), trained on millions of 3D patches. We employ an efficient masked autoencoder transformer to complete partial sequences into comprehensive shapes in latent space. Our approach is extensively evaluated on partial observations from ShapeNet and the ABC dataset where only fractions of the objects are given. The proposed POC-SLT architecture compares favorably with several baseline state-of-the-art methods, demonstrating a significant improvement in 3D shape completion, both qualitatively and quantitatively.
- Abstract(参考訳): 3次元幾何形状完成ヒンジは、表現学習と幾何データの深い理解に基づく。
データの3次元的な性質について深い洞察が得られなければ、この課題は達成不可能である。
本研究は,SDF(Signed Distance Fields)を表す潜時空間で動作する変圧器を提案することによって,部分的な観察を行う3次元形状完備化の課題に対処する。
モノリシックなボリュームの代わりに、オブジェクトのSDFは小さな高解像度のパッチに分割され、遅延コードのシーケンスにつながる。
このアプローチは、数百万の3Dパッチでトレーニングされた可変オートエンコーダ(VAE)を通じて学習されたスムーズな遅延空間の符号化に依存している。
マスク付きオートエンコーダ変換器を用いて,部分列を潜在空間の包括的形状に変換する。
提案手法は,ShapeNet と ABC データセットから部分的な観測を行い,対象物の一部のみを付与する手法である。
提案したPOC-SLTアーキテクチャは,いくつかのベースライン・オブ・ザ・アート手法と比較し,定性的かつ定量的に3次元形状の完成度を著しく向上させた。
関連論文リスト
- A Recipe for Geometry-Aware 3D Mesh Transformers [2.0992612407358293]
本研究では, ノード数可変のパッチを収容するパッチレベルで, 特徴を埋め込む手法について検討する。
本研究は,1)一般的な3次元メッシュトランスフォーマにおける熱拡散による構造的および位置的埋め込みの重要性,2)学習の強化における測地的マスキングや機能的相互作用といった新しい要素の有効性,3)セグメント化と分類作業の課題における提案手法の優れた性能と効率性など,重要な知見を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-10-31T19:13:31Z) - NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.772319840580074]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T04:09:34Z) - LASA: Instance Reconstruction from Real Scans using A Large-scale
Aligned Shape Annotation Dataset [17.530432165466507]
本稿では,新しいクロスモーダル形状再構成法とOccGOD法を提案する。
本手法は,インスタンスレベルのシーン再構成と3次元オブジェクト検出の両タスクにおいて,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T18:50:10Z) - 3DSGrasp: 3D Shape-Completion for Robotic Grasp [81.1638620745356]
オブジェクトの完全な3Dポイントクラウドデータ(PCD)が利用可能であれば、現実のロボットの把握は堅牢に行うことができる。
実際に、PCDは、握る動作の前に、オブジェクトがほとんど見ていない、そしてまばらな視点から見られているとき、しばしば不完全である。
そこで我々は3DSGraspという新しい把握戦略を提案する。これは部分的なPCDから欠落した幾何を予測し、信頼性の高い把握ポーズを生成する。
論文 参考訳(メタデータ) (2023-01-02T20:23:05Z) - ShapeFormer: Transformer-based Shape Completion via Sparse
Representation [41.33457875133559]
本稿では,不完全でノイズの多い点雲に条件付きオブジェクト完了の分布を生成するネットワークであるShapeFormerを提案する。
結果の分布をサンプリングして、入力に忠実な状態で、それぞれがもっともらしい形状の詳細を示す、可能性のある完了を生成する。
論文 参考訳(メタデータ) (2022-01-25T13:58:30Z) - High-fidelity 3D Model Compression based on Key Spheres [6.59007277780362]
明示的な鍵球を入力として用いたSDF予測ネットワークを提案する。
提案手法は,高忠実かつ高圧縮な3次元オブジェクトの符号化と再構成を実現する。
論文 参考訳(メタデータ) (2022-01-19T09:21:54Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Deep Implicit Templates for 3D Shape Representation [70.9789507686618]
深い暗黙表現における明示的な対応推論を支援する新しい3次元形状表現を提案する。
我々のキーとなる考え方は、テンプレートの暗黙関数の条件変形としてDIFを定式化することである。
提案手法は,形状の集合に対する一般的な暗黙テンプレートを学習するだけでなく,すべての形状を相互に同時に対応させることも可能であることを示す。
論文 参考訳(メタデータ) (2020-11-30T06:01:49Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。