論文の概要: Mesh Convolution with Continuous Filters for 3D Surface Parsing
- arxiv url: http://arxiv.org/abs/2112.01801v3
- Date: Sat, 22 Apr 2023 02:14:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 00:52:52.285400
- Title: Mesh Convolution with Continuous Filters for 3D Surface Parsing
- Title(参考訳): 3次元表面解析のための連続フィルタによるメッシュ畳み込み
- Authors: Huan Lei, Naveed Akhtar, Mubarak Shah, and Ajmal Mian
- Abstract要約: 本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 101.25796935464648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric feature learning for 3D surfaces is critical for many applications
in computer graphics and 3D vision. However, deep learning currently lags in
hierarchical modeling of 3D surfaces due to the lack of required operations
and/or their efficient implementations. In this paper, we propose a series of
modular operations for effective geometric feature learning from 3D triangle
meshes. These operations include novel mesh convolutions, efficient mesh
decimation and associated mesh (un)poolings. Our mesh convolutions exploit
spherical harmonics as orthonormal bases to create continuous convolutional
filters. The mesh decimation module is GPU-accelerated and able to process
batched meshes on-the-fly, while the (un)pooling operations compute features
for up/down-sampled meshes. We provide open-source implementation of these
operations, collectively termed Picasso. Picasso supports heterogeneous mesh
batching and processing. Leveraging its modular operations, we further
contribute a novel hierarchical neural network for perceptual parsing of 3D
surfaces, named PicassoNet++. It achieves highly competitive performance for
shape analysis and scene segmentation on prominent 3D benchmarks. The code,
data and trained models are available at
https://github.com/EnyaHermite/Picasso.
- Abstract(参考訳): 3次元曲面の幾何学的特徴学習は、コンピュータグラフィックスや3dビジョンの多くの応用において重要である。
しかし、現在ディープラーニングは、必要な操作の欠如や効率的な実装のために、3D表面の階層的モデリングに遅れている。
本稿では,3次元トライアングルメッシュからの効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
これらの操作には、新しいメッシュ畳み込み、効率的なメッシュデシメーション、関連するメッシュ(un)プールが含まれる。
メッシュ畳み込みは球面調和を正規直交基底として連続畳み込みフィルタを作成する。
メッシュデシメーションモジュールはGPUアクセラレーションされ、バッチ処理されたメッシュをオンザフライで処理できる。
われわれはこれらの操作をオープンソースで実装し、Picassoと呼ぶ。
Picassoは異種メッシュバッチ処理と処理をサポートする。
モジュラー操作を活用することで、PicassoNet++という名前の3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提供する。
顕著な3Dベンチマークで形状解析とシーンセグメンテーションにおいて高い競争力を発揮する。
コード、データ、トレーニングされたモデルはhttps://github.com/EnyaHermite/Picasso.comで入手できる。
関連論文リスト
- Bridging 3D Gaussian and Mesh for Freeview Video Rendering [57.21847030980905]
GauMeshはダイナミックシーンのモデリングとレンダリングのために3D GaussianとMeshをブリッジする。
提案手法は, 動的シーンの異なる部分を表現するために, プリミティブの適切なタイプに適応することを示す。
論文 参考訳(メタデータ) (2024-03-18T04:01:26Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - Smooth Mesh Estimation from Depth Data using Non-Smooth Convex
Optimization [28.786685021545622]
深度マップから直接3Dメッシュを構築し,立体視で三角測量したスパースランドマークを構築した。
当社のアプローチでは,リアルタイムに動作しながら,直接メッシュ再構築の最先端性を大幅に向上するスムーズで正確な3Dメッシュを生成する。
論文 参考訳(メタデータ) (2021-08-06T06:29:34Z) - Subdivision-Based Mesh Convolution Networks [38.09613983540932]
畳み込みニューラルネットワーク(CNN)は、2Dコンピュータビジョンにおいて大きなブレークスルーをもたらした。
本稿では,ループ分割シーケンス接続を伴う3次元トライアングルメッシュのための新しいCNNフレームワークSubdivNetを提案する。
メッシュ分類,セグメンテーション,対応,実世界からの検索実験により,SubdivNetの有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-06-04T06:50:34Z) - Picasso: A CUDA-based Library for Deep Learning over 3D Meshes [46.8917772877766]
複雑な実世界の3dメッシュ上でディープラーニングを行うための,新たなモジュールからなるライブラリであるpicassoを提案する。
我々は,ネットワーク解像度の低減を図るために,GPU加速メッシュデシメーションを設計する。
S3DIS上での競合セグメンテーション結果を用いた提案モジュールの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-28T08:04:50Z) - Deep Active Surface Models [60.027353171412216]
アクティブサーフェスモデルは複雑な3次元表面をモデル化するのに有用な長い歴史を持っているが、ディープネットワークと組み合わせて使用されるのはアクティブ・コンターのみである。
グラフ畳み込みネットワークにシームレスに統合して、洗練された滑らかさを強制できるレイヤを導入します。
論文 参考訳(メタデータ) (2020-11-17T18:48:28Z) - Making a Case for 3D Convolutions for Object Segmentation in Videos [16.167397418720483]
本研究では,3次元畳み込みネットワークが高精細な物体分割などの高密度映像予測タスクに効果的に適用可能であることを示す。
本稿では,新しい3Dグローバル・コンボリューション・レイヤと3Dリファインメント・モジュールからなる3Dデコーダアーキテクチャを提案する。
提案手法は,DAVIS'16 Unsupervised, FBMS, ViSalベンチマークにおいて,既存の最先端技術よりもはるかに優れている。
論文 参考訳(メタデータ) (2020-08-26T12:24:23Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - DualConvMesh-Net: Joint Geodesic and Euclidean Convolutions on 3D Meshes [28.571946680616765]
本稿では3次元幾何データよりも深い階層的畳み込みネットワークのファミリーを提案する。
最初の型である測地的畳み込みは、メッシュ表面またはグラフ上のカーネルウェイトを定義する。
第2のタイプであるユークリッドの畳み込みは、基盤となるメッシュ構造とは独立である。
論文 参考訳(メタデータ) (2020-04-02T13:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。