論文の概要: Learning Local Neighboring Structure for Robust 3D Shape Representation
- arxiv url: http://arxiv.org/abs/2004.09995v3
- Date: Mon, 21 Dec 2020 13:32:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 06:38:19.095727
- Title: Learning Local Neighboring Structure for Robust 3D Shape Representation
- Title(参考訳): ロバスト3次元形状表現のための局所近傍構造学習
- Authors: Zhongpai Gao, Junchi Yan, Guangtao Zhai, Juyong Zhang, Yiyan Yang,
Xiaokang Yang
- Abstract要約: 3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
- 参考スコア(独自算出の注目度): 143.15904669246697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mesh is a powerful data structure for 3D shapes. Representation learning for
3D meshes is important in many computer vision and graphics applications. The
recent success of convolutional neural networks (CNNs) for structured data
(e.g., images) suggests the value of adapting insight from CNN for 3D shapes.
However, 3D shape data are irregular since each node's neighbors are unordered.
Various graph neural networks for 3D shapes have been developed with isotropic
filters or predefined local coordinate systems to overcome the node
inconsistency on graphs. However, isotropic filters or predefined local
coordinate systems limit the representation power. In this paper, we propose a
local structure-aware anisotropic convolutional operation (LSA-Conv) that
learns adaptive weighting matrices for each node according to the local
neighboring structure and performs shared anisotropic filters. In fact, the
learnable weighting matrix is similar to the attention matrix in the random
synthesizer -- a new Transformer model for natural language processing (NLP).
Comprehensive experiments demonstrate that our model produces significant
improvement in 3D shape reconstruction compared to state-of-the-art methods.
- Abstract(参考訳): Meshは3D形状のための強力なデータ構造です。
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
構造化データ(例えば画像)に対する畳み込みニューラルネットワーク(CNN)の最近の成功は、CNNからの洞察を3次元形状に適用する価値を示唆している。
しかし、各ノードの近傍は非順序であるため、3次元形状データは不規則である。
3次元形状のための様々なグラフニューラルネットワークは、グラフ上のノードの不整合を克服するために等方性フィルタや事前定義された局所座標系を用いて開発されている。
しかし、等方性フィルタや事前定義された局所座標系は表現力を制限する。
本稿では,各ノードの適応重み付け行列を局所的近傍構造に従って学習し,共有異方性フィルタを行う局所構造対応異方性畳み込み演算(LSA-Conv)を提案する。
実際、学習可能な重み付け行列は、自然言語処理(NLP)のための新しいトランスフォーマーモデルであるランダムシンセサイザーの注意行列と似ている。
包括的実験により,本モデルが最新手法と比較して3次元形状復元に有意な改善をもたらすことを実証した。
関連論文リスト
- MeT: A Graph Transformer for Semantic Segmentation of 3D Meshes [10.667492516216887]
本稿では3次元メッシュのセマンティックセグメンテーションのためのトランスフォーマーに基づく手法を提案する。
隣接行列のラプラシア固有ベクトルを用いて位置符号化を行う。
提案手法は,3次元メッシュのセマンティックセグメンテーションにおける最先端の性能を示す。
論文 参考訳(メタデータ) (2023-07-03T15:45:14Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - Dual Octree Graph Networks for Learning Adaptive Volumetric Shape
Representations [21.59311861556396]
本手法は,3次元形状の体積場を,オクツリーによって構成された適応的特徴量で符号化する。
エンコーダ・デコーダネットワークは、オクツリーノードの二重グラフ上のグラフ畳み込みに基づいて、適応的な特徴量を学ぶように設計されている。
提案手法は, 形状詳細を効果的に符号化し, 高速な3次元形状復元を可能にし, 訓練カテゴリから3次元形状をモデル化するための優れた汎用性を示す。
論文 参考訳(メタデータ) (2022-05-05T17:56:34Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - Dense Graph Convolutional Neural Networks on 3D Meshes for 3D Object
Segmentation and Classification [0.0]
本稿では3次元メッシュ上でのグラフ畳み込みニューラルネットワーク(GCN)の設計について述べる。
メッシュの顔を基本処理単位とし、各ノードが顔に対応するグラフとして3Dメッシュを表現する。
論文 参考訳(メタデータ) (2021-06-30T02:17:16Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z) - Rotation-Invariant Local-to-Global Representation Learning for 3D Point
Cloud [42.86112554931754]
本稿では,3次元点クラウドデータに対する局所的-言語的表現学習アルゴリズムを提案する。
本モデルは,グラフ畳み込みニューラルネットワークに基づく多レベル抽象化を利用する。
提案アルゴリズムは,3次元物体の回転認識とセグメント化のベンチマークにおいて,最先端の性能を示す。
論文 参考訳(メタデータ) (2020-10-07T10:30:20Z) - SeqXY2SeqZ: Structure Learning for 3D Shapes by Sequentially Predicting
1D Occupancy Segments From 2D Coordinates [61.04823927283092]
本稿では,各2次元位置における関数の出力が内部の線分列である2次元関数を用いて3次元形状を表現することを提案する。
本研究では,SeqXY2SeqZと呼ばれるセック2Seqモデルを用いて,2つの任意の軸に沿った2次元座標列から3つの軸に沿った1次元位置の列への写像を学習する手法を提案する。
実験の結果,SeqXY2SeqZは広く使用されているベンチマークで最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-03-12T00:24:36Z) - 3D Shape Segmentation with Geometric Deep Learning [2.512827436728378]
本稿では,部分分割問題としてセグメント化全体を解くために,3次元形状の3次元拡張ビューを生成するニューラルネットワークベースのアプローチを提案する。
提案手法は,公開データセットの3次元形状と,フォトグラム法を用いて再構成した実物体を用いて検証する。
論文 参考訳(メタデータ) (2020-02-02T14:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。