論文の概要: Oriented-grid Encoder for 3D Implicit Representations
- arxiv url: http://arxiv.org/abs/2402.06752v1
- Date: Fri, 9 Feb 2024 19:28:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 19:34:32.252173
- Title: Oriented-grid Encoder for 3D Implicit Representations
- Title(参考訳): 3次元命令表現のための配向グリッドエンコーダ
- Authors: Arihant Gaur, G. Dias Pais and Pedro Miraldo
- Abstract要約: 本論文は,3次元幾何エンコーダの3次元特性を明示的に利用した最初のものである。
提案手法は,従来の手法と比較して最先端の結果が得られる。
- 参考スコア(独自算出の注目度): 10.02138130221506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Encoding 3D points is one of the primary steps in learning-based implicit
scene representation. Using features that gather information from neighbors
with multi-resolution grids has proven to be the best geometric encoder for
this task. However, prior techniques do not exploit some characteristics of
most objects or scenes, such as surface normals and local smoothness. This
paper is the first to exploit those 3D characteristics in 3D geometric encoders
explicitly. In contrast to prior work on using multiple levels of details,
regular cube grids, and trilinear interpolation, we propose 3D-oriented grids
with a novel cylindrical volumetric interpolation for modeling local planar
invariance. In addition, we explicitly include a local feature aggregation for
feature regularization and smoothing of the cylindrical interpolation features.
We evaluate our approach on ABC, Thingi10k, ShapeNet, and Matterport3D, for
object and scene representation. Compared to the use of regular grids, our
geometric encoder is shown to converge in fewer steps and obtain sharper 3D
surfaces. When compared to the prior techniques, our method gets
state-of-the-art results.
- Abstract(参考訳): 3dポイントのエンコーディングは、学習に基づく暗黙的なシーン表現の主要なステップの1つである。
マルチレゾリューショングリッドで近隣の情報を収集する機能を利用することで、このタスクに最適な幾何学的エンコーダであることが証明されている。
しかし、従来の手法は、表面の正常さや局所的な滑らかさなど、ほとんどの物体やシーンの特徴を生かしていない。
本論文は3次元幾何エンコーダにおけるこれらの3次元特性を明示的に利用した最初のものである。
複数の詳細レベル、正規立方体格子、およびトリリニア補間に関する先行研究とは対照的に、局所平面不変性をモデル化するための新しい円筒形体積補間を持つ3次元配向格子を提案する。
さらに,特徴の正規化と円筒補間特徴の平滑化のための局所的特徴集約を明示的に含む。
本研究では,ABC,Thingi10k,ShapeNet,Matterport3Dのオブジェクトおよびシーン表現に対するアプローチを評価する。
正規格子を用いた場合と比較すると, 幾何エンコーダはより少ないステップで収束し, よりシャープな3d表面が得られることがわかった。
従来の手法と比較すると, 最新の結果が得られる。
関連論文リスト
- Occupancy-Based Dual Contouring [12.944046673902415]
本稿では,2重畳み込み方式を提案する。
本手法は,GPU並列化を最大化するために,学習不要かつ慎重に設計されている。
論文 参考訳(メタデータ) (2024-09-20T11:32:21Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D
Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。
複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。
その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文 参考訳(メタデータ) (2022-08-18T00:48:15Z) - H3D-Net: Few-Shot High-Fidelity 3D Head Reconstruction [27.66008315400462]
表面形状を暗黙的に表現する最近の学習手法は、多視点3次元再構成の問題において顕著な結果を示している。
我々はこれらの制限を,数発のフル3次元頭部再構成の特定の問題に対処する。
暗黙の表現を用いて,数千個の不完全な生スキャンから3次元頭部形状モデルを学習する。
論文 参考訳(メタデータ) (2021-07-26T23:04:18Z) - Exploring Deep 3D Spatial Encodings for Large-Scale 3D Scene
Understanding [19.134536179555102]
生の3次元点雲の空間的特徴を非方向性グラフモデルに符号化することで,CNNに基づくアプローチの限界を克服する代替手法を提案する。
提案手法は、訓練時間とモデル安定性を改善して、最先端の精度で達成し、さらなる研究の可能性を示す。
論文 参考訳(メタデータ) (2020-11-29T12:56:19Z) - Cylinder3D: An Effective 3D Framework for Driving-scene LiDAR Semantic
Segmentation [87.54570024320354]
大規模運転シーンのLiDARセマンティックセマンティックセグメンテーションのための最先端の手法は、しばしば2D空間の点雲を投影して処理する。
3D-to-2Dプロジェクションの問題に取り組むための簡単な解決策は、3D表現を保ち、3D空間の点を処理することである。
我々は3次元シリンダー分割と3次元シリンダー畳み込みに基づくフレームワークをCylinder3Dとして開発し,3次元トポロジの関係と運転シーンの点雲の構造を利用する。
論文 参考訳(メタデータ) (2020-08-04T13:56:19Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - Local Implicit Grid Representations for 3D Scenes [24.331110387905962]
本稿では,拡張性と汎用性のために設計された新しい3次元形状表現であるLocal Implicit Grid Representationsを紹介する。
我々はオートエンコーダを訓練し、その大きさで3次元形状の局所的な作物の埋め込みを学習する。
次に,デコーダを形状最適化のコンポーネントとして使用し,重なり合う作物の正規格子上の潜伏符号の集合を解く。
論文 参考訳(メタデータ) (2020-03-19T18:58:13Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z) - 3D Shape Segmentation with Geometric Deep Learning [2.512827436728378]
本稿では,部分分割問題としてセグメント化全体を解くために,3次元形状の3次元拡張ビューを生成するニューラルネットワークベースのアプローチを提案する。
提案手法は,公開データセットの3次元形状と,フォトグラム法を用いて再構成した実物体を用いて検証する。
論文 参考訳(メタデータ) (2020-02-02T14:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。