論文の概要: Learning Deep Implicit Functions for 3D Shapes with Dynamic Code Clouds
- arxiv url: http://arxiv.org/abs/2203.14048v2
- Date: Wed, 30 Mar 2022 03:15:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 11:44:09.169664
- Title: Learning Deep Implicit Functions for 3D Shapes with Dynamic Code Clouds
- Title(参考訳): 動的コードクラウドを用いた3次元形状の深い暗黙関数の学習
- Authors: Tianyang Li, Xin Wen, Yu-Shen Liu, Hua Su, Zhizhong Han
- Abstract要約: Deep Implicit Function (DIF) は効率的な3次元形状表現として人気を集めている。
我々は、DCC-DIFという名前のDynamic Code CloudでDIFを学ぶことを提案する。
本手法は,局所符号と学習可能な位置ベクトルを明示的に関連付け,位置ベクトルは連続であり,動的に最適化できる。
- 参考スコア(独自算出の注目度): 56.385495276042406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Implicit Function (DIF) has gained popularity as an efficient 3D shape
representation. To capture geometry details, current methods usually learn DIF
using local latent codes, which discretize the space into a regular 3D grid (or
octree) and store local codes in grid points (or octree nodes). Given a query
point, the local feature is computed by interpolating its neighboring local
codes with their positions. However, the local codes are constrained at
discrete and regular positions like grid points, which makes the code positions
difficult to be optimized and limits their representation ability. To solve
this problem, we propose to learn DIF with Dynamic Code Cloud, named DCC-DIF.
Our method explicitly associates local codes with learnable position vectors,
and the position vectors are continuous and can be dynamically optimized, which
improves the representation ability. In addition, we propose a novel code
position loss to optimize the code positions, which heuristically guides more
local codes to be distributed around complex geometric details. In contrast to
previous methods, our DCC-DIF represents 3D shapes more efficiently with a
small amount of local codes, and improves the reconstruction quality.
Experiments demonstrate that DCC-DIF achieves better performance over previous
methods. Code and data are available at https://github.com/lity20/DCCDIF.
- Abstract(参考訳): Deep Implicit Function (DIF) は効率的な3次元形状表現として人気を集めている。
幾何学の詳細を捉えるために、現在の手法では、通常の3dグリッド(octree)に空間を区別し、ローカルコードをグリッドポイント(octreeノード)に格納するローカル潜在コードを使ってdifを学習する。
クエリポイントが与えられると、ローカル機能は、隣接するローカルコードとその位置を補間することで計算される。
しかし、ローカルコードはグリッドポイントのような離散的かつ規則的な位置で制約されているため、最適化が困難になり、表現能力が制限される。
そこで本研究では,Defを動的コードクラウドで学習するDCC-DIFを提案する。
提案手法は,局所符号と学習可能な位置ベクトルを明示的に関連付け,位置ベクトルは連続であり,動的に最適化され,表現能力が向上する。
さらに,複雑な幾何学的詳細の周囲に分散するように,より局所的なコードをヒューリスティックに誘導する,符号位置を最適化する新しい符号位置損失を提案する。
従来の手法とは対照的に,dcc-difは少ない局所符号で3次元形状をより効率的に表現し,再構成品質を向上させる。
実験により、DCC-DIFは従来の手法よりも優れた性能を発揮することが示された。
コードとデータはhttps://github.com/lity20/dccdifで入手できる。
関連論文リスト
- Oriented-grid Encoder for 3D Implicit Representations [10.02138130221506]
本論文は,3次元幾何エンコーダの3次元特性を明示的に利用した最初のものである。
提案手法は,従来の手法と比較して最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-02-09T19:28:13Z) - ConDaFormer: Disassembled Transformer with Local Structure Enhancement
for 3D Point Cloud Understanding [105.98609765389895]
トランスフォーマーは、最近3Dポイントクラウド理解のために研究されている。
0.1万を超える多数のポイントは、ポイントクラウドデータに対してグローバルな自己注意を可能にする。
本稿では,ConDaFormerという新しい変圧器ブロックを開発する。
論文 参考訳(メタデータ) (2023-12-18T11:19:45Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - Quadric Representations for LiDAR Odometry, Mapping and Localization [93.24140840537912]
現在のLiDARオードメトリ、マッピング、ローカライズ手法は、3Dシーンのポイントワイズ表現を利用する。
3次元オブジェクトのよりコンパクトな表現である2次元曲面を用いたシーン記述法を提案する。
提案手法は低レイテンシとメモリの有効性を維持しつつ、競争力があり、しかも精度も優れている。
論文 参考訳(メタデータ) (2023-04-27T13:52:01Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Dual Octree Graph Networks for Learning Adaptive Volumetric Shape
Representations [21.59311861556396]
本手法は,3次元形状の体積場を,オクツリーによって構成された適応的特徴量で符号化する。
エンコーダ・デコーダネットワークは、オクツリーノードの二重グラフ上のグラフ畳み込みに基づいて、適応的な特徴量を学ぶように設計されている。
提案手法は, 形状詳細を効果的に符号化し, 高速な3次元形状復元を可能にし, 訓練カテゴリから3次元形状をモデル化するための優れた汎用性を示す。
論文 参考訳(メタデータ) (2022-05-05T17:56:34Z) - Distinctive 3D local deep descriptors [2.512827436728378]
ポイントクラウドパッチは抽出され、推定されたローカル参照フレームに対して正準化され、PointNetベースのディープニューラルネットワークによって符号化される。
我々は、異なるセンサを用いて再構成された点雲からなる複数のデータセットにおいて、DIPを、別の手作り、ディープディスクリプタと比較し、比較した。
論文 参考訳(メタデータ) (2020-09-01T06:25:06Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Local Implicit Grid Representations for 3D Scenes [24.331110387905962]
本稿では,拡張性と汎用性のために設計された新しい3次元形状表現であるLocal Implicit Grid Representationsを紹介する。
我々はオートエンコーダを訓練し、その大きさで3次元形状の局所的な作物の埋め込みを学習する。
次に,デコーダを形状最適化のコンポーネントとして使用し,重なり合う作物の正規格子上の潜伏符号の集合を解く。
論文 参考訳(メタデータ) (2020-03-19T18:58:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。