論文の概要: Picasso: A CUDA-based Library for Deep Learning over 3D Meshes
- arxiv url: http://arxiv.org/abs/2103.15076v1
- Date: Sun, 28 Mar 2021 08:04:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 15:03:33.455081
- Title: Picasso: A CUDA-based Library for Deep Learning over 3D Meshes
- Title(参考訳): Picasso:3DメッシュによるディープラーニングのためのCUDAベースのライブラリ
- Authors: Huan Lei, Naveed Akhtar, Ajmal Mian
- Abstract要約: 複雑な実世界の3dメッシュ上でディープラーニングを行うための,新たなモジュールからなるライブラリであるpicassoを提案する。
我々は,ネットワーク解像度の低減を図るために,GPU加速メッシュデシメーションを設計する。
S3DIS上での競合セグメンテーション結果を用いた提案モジュールの有効性を実証する。
- 参考スコア(独自算出の注目度): 46.8917772877766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Picasso, a CUDA-based library comprising novel modules for deep
learning over complex real-world 3D meshes. Hierarchical neural architectures
have proved effective in multi-scale feature extraction which signifies the
need for fast mesh decimation. However, existing methods rely on CPU-based
implementations to obtain multi-resolution meshes. We design GPU-accelerated
mesh decimation to facilitate network resolution reduction efficiently
on-the-fly. Pooling and unpooling modules are defined on the vertex clusters
gathered during decimation. For feature learning over meshes, Picasso contains
three types of novel convolutions namely, facet2vertex, vertex2facet, and
facet2facet convolution. Hence, it treats a mesh as a geometric structure
comprising vertices and facets, rather than a spatial graph with edges as
previous methods do. Picasso also incorporates a fuzzy mechanism in its filters
for robustness to mesh sampling (vertex density). It exploits Gaussian mixtures
to define fuzzy coefficients for the facet2vertex convolution, and barycentric
interpolation to define the coefficients for the remaining two convolutions. In
this release, we demonstrate the effectiveness of the proposed modules with
competitive segmentation results on S3DIS. The library will be made public
through https://github.com/hlei-ziyan/Picasso.
- Abstract(参考訳): 複雑な現実世界の3Dメッシュ上でのディープラーニングのための新しいモジュールで構成されるCUDAベースのライブラリであるPicassoを紹介する。
階層型ニューラルネットワークアーキテクチャは、高速メッシュデシミテーションの必要性を示すマルチスケールの特徴抽出に有効であることが証明されている。
しかし、既存の手法はマルチレゾリューションメッシュを得るためにCPUベースの実装に依存している。
我々は,ネットワーク解像度の低減を図るために,GPU加速メッシュデシメーションを設計する。
プールおよびアンプールモジュールは、デシメーション時に収集された頂点クラスタ上で定義される。
メッシュ上の特徴学習には、facet2vertex、vertex2facet、facet2facetという3種類の新しい畳み込みが含まれている。
したがって、メッシュを従来の方法のようにエッジを持つ空間グラフではなく、頂点と面からなる幾何学的構造として扱う。
Picassoはまた、メッシュサンプリング(頂点密度)に対する堅牢性のためのファジィ機構をフィルタに組み込んでいる。
これは、ファゼット2頂点の畳み込みのファジィ係数を定義するためにガウス混合を利用し、残りの2つの畳み込みの係数を定義するためにバリ中心補間を行う。
本稿では,S3DIS上での競合セグメンテーション結果を用いた提案モジュールの有効性を示す。
ライブラリはhttps://github.com/hlei-ziyan/picassoで公開される。
関連論文リスト
- MinkUNeXt: Point Cloud-based Large-scale Place Recognition using 3D
Sparse Convolutions [1.124958340749622]
MinkUNeXtは、新しい3D MinkNeXt Blockをベースとした、ポイントクラウドからの位置認識のための効率的かつ効率的なアーキテクチャである。
提案の徹底的な評価は、Oxford RobotCarとIn-houseデータセットを用いて行われている。
論文 参考訳(メタデータ) (2024-03-12T12:25:54Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - Mesh Convolution with Continuous Filters for 3D Surface Parsing [101.25796935464648]
本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T09:16:49Z) - Subdivision-Based Mesh Convolution Networks [38.09613983540932]
畳み込みニューラルネットワーク(CNN)は、2Dコンピュータビジョンにおいて大きなブレークスルーをもたらした。
本稿では,ループ分割シーケンス接続を伴う3次元トライアングルメッシュのための新しいCNNフレームワークSubdivNetを提案する。
メッシュ分類,セグメンテーション,対応,実世界からの検索実験により,SubdivNetの有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-06-04T06:50:34Z) - Learning Deformable Tetrahedral Meshes for 3D Reconstruction [78.0514377738632]
学習に基づく3次元再構成に対応する3次元形状表現は、機械学習とコンピュータグラフィックスにおいてオープンな問題である。
ニューラル3D再構成に関するこれまでの研究は、利点だけでなく、ポイントクラウド、ボクセル、サーフェスメッシュ、暗黙の関数表現といった制限も示していた。
Deformable Tetrahedral Meshes (DefTet) を, ボリューム四面体メッシュを再構成問題に用いるパラメータ化として導入する。
論文 参考訳(メタデータ) (2020-11-03T02:57:01Z) - Primal-Dual Mesh Convolutional Neural Networks [62.165239866312334]
本稿では,グラフ・ニューラル・ネットワークの文献からトライアングル・メッシュへ引き起こされた原始双対のフレームワークを提案する。
提案手法は,3次元メッシュのエッジと顔の両方を入力として特徴付け,動的に集約する。
メッシュ単純化の文献から得られたツールを用いて、我々のアプローチに関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-10-23T14:49:02Z) - DualConvMesh-Net: Joint Geodesic and Euclidean Convolutions on 3D Meshes [28.571946680616765]
本稿では3次元幾何データよりも深い階層的畳み込みネットワークのファミリーを提案する。
最初の型である測地的畳み込みは、メッシュ表面またはグラフ上のカーネルウェイトを定義する。
第2のタイプであるユークリッドの畳み込みは、基盤となるメッシュ構造とは独立である。
論文 参考訳(メタデータ) (2020-04-02T13:52:00Z) - Recalibrating 3D ConvNets with Project & Excite [6.11737116137921]
畳み込みニューラルネットワーク(F-CNN)は、コンピュータビジョンと医用画像におけるセグメンテーションタスクの最先端のパフォーマンスを達成する。
既存の2Dリカバリ手法を3Dに拡張し, 簡単に比較できる汎用的な圧縮-プロセス-リカバリレートパイプラインを提案する。
PEモジュールは3次元F-CNNに容易に統合でき、Dice Scoreでは0.3まで性能が向上し、他の再校正ブロックの3次元拡張よりも性能が向上することを示した。
論文 参考訳(メタデータ) (2020-02-25T16:07:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。