論文の概要: Mesh Convolution with Continuous Filters for 3D Surface Parsing
- arxiv url: http://arxiv.org/abs/2112.01801v3
- Date: Sat, 22 Apr 2023 02:14:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 00:52:52.285400
- Title: Mesh Convolution with Continuous Filters for 3D Surface Parsing
- Title(参考訳): 3次元表面解析のための連続フィルタによるメッシュ畳み込み
- Authors: Huan Lei, Naveed Akhtar, Mubarak Shah, and Ajmal Mian
- Abstract要約: 本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 101.25796935464648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric feature learning for 3D surfaces is critical for many applications
in computer graphics and 3D vision. However, deep learning currently lags in
hierarchical modeling of 3D surfaces due to the lack of required operations
and/or their efficient implementations. In this paper, we propose a series of
modular operations for effective geometric feature learning from 3D triangle
meshes. These operations include novel mesh convolutions, efficient mesh
decimation and associated mesh (un)poolings. Our mesh convolutions exploit
spherical harmonics as orthonormal bases to create continuous convolutional
filters. The mesh decimation module is GPU-accelerated and able to process
batched meshes on-the-fly, while the (un)pooling operations compute features
for up/down-sampled meshes. We provide open-source implementation of these
operations, collectively termed Picasso. Picasso supports heterogeneous mesh
batching and processing. Leveraging its modular operations, we further
contribute a novel hierarchical neural network for perceptual parsing of 3D
surfaces, named PicassoNet++. It achieves highly competitive performance for
shape analysis and scene segmentation on prominent 3D benchmarks. The code,
data and trained models are available at
https://github.com/EnyaHermite/Picasso.
- Abstract(参考訳): 3次元曲面の幾何学的特徴学習は、コンピュータグラフィックスや3dビジョンの多くの応用において重要である。
しかし、現在ディープラーニングは、必要な操作の欠如や効率的な実装のために、3D表面の階層的モデリングに遅れている。
本稿では,3次元トライアングルメッシュからの効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
これらの操作には、新しいメッシュ畳み込み、効率的なメッシュデシメーション、関連するメッシュ(un)プールが含まれる。
メッシュ畳み込みは球面調和を正規直交基底として連続畳み込みフィルタを作成する。
メッシュデシメーションモジュールはGPUアクセラレーションされ、バッチ処理されたメッシュをオンザフライで処理できる。
われわれはこれらの操作をオープンソースで実装し、Picassoと呼ぶ。
Picassoは異種メッシュバッチ処理と処理をサポートする。
モジュラー操作を活用することで、PicassoNet++という名前の3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提供する。
顕著な3Dベンチマークで形状解析とシーンセグメンテーションにおいて高い競争力を発揮する。
コード、データ、トレーニングされたモデルはhttps://github.com/EnyaHermite/Picasso.comで入手できる。
関連論文リスト
- MeshConv3D: Efficient convolution and pooling operators for triangular 3D meshes [0.0]
MeshConv3Dは、特殊な畳み込みとフェース崩壊ベースのプール演算子を統合する、3Dメッシュ専用手法である。
3つの異なるベンチマークデータセットで得られた実験結果から,提案手法により,同等あるいは優れた分類結果が得られることが示された。
論文 参考訳(メタデータ) (2025-01-07T14:41:26Z) - DMesh++: An Efficient Differentiable Mesh for Complex Shapes [51.75054400014161]
2次元および3次元に新しい微分可能なメッシュ処理法を導入する。
メッシュ分解能を2次元の局所幾何学に適応させて効率よく表現するアルゴリズムを提案する。
本研究では,2次元ポイントクラウドと3次元マルチビュー再構成タスクにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-12-21T21:16:03Z) - DCSEG: Decoupled 3D Open-Set Segmentation using Gaussian Splatting [0.0]
オープンセット3Dセグメンテーションは、下流ロボティクスと拡張現実/バーチャルリアリティーアプリケーションにとって大きな関心事である。
本稿では,新しい3次元表現とセマンティックセグメンテーション基盤モデルに対するモジュラリティと適応性を確保するために,分離された3次元セグメンテーションパイプラインを提案する。
論文 参考訳(メタデータ) (2024-12-14T21:26:44Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - Picasso: A CUDA-based Library for Deep Learning over 3D Meshes [46.8917772877766]
複雑な実世界の3dメッシュ上でディープラーニングを行うための,新たなモジュールからなるライブラリであるpicassoを提案する。
我々は,ネットワーク解像度の低減を図るために,GPU加速メッシュデシメーションを設計する。
S3DIS上での競合セグメンテーション結果を用いた提案モジュールの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-28T08:04:50Z) - Deep Active Surface Models [60.027353171412216]
アクティブサーフェスモデルは複雑な3次元表面をモデル化するのに有用な長い歴史を持っているが、ディープネットワークと組み合わせて使用されるのはアクティブ・コンターのみである。
グラフ畳み込みネットワークにシームレスに統合して、洗練された滑らかさを強制できるレイヤを導入します。
論文 参考訳(メタデータ) (2020-11-17T18:48:28Z) - Making a Case for 3D Convolutions for Object Segmentation in Videos [16.167397418720483]
本研究では,3次元畳み込みネットワークが高精細な物体分割などの高密度映像予測タスクに効果的に適用可能であることを示す。
本稿では,新しい3Dグローバル・コンボリューション・レイヤと3Dリファインメント・モジュールからなる3Dデコーダアーキテクチャを提案する。
提案手法は,DAVIS'16 Unsupervised, FBMS, ViSalベンチマークにおいて,既存の最先端技術よりもはるかに優れている。
論文 参考訳(メタデータ) (2020-08-26T12:24:23Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。