論文の概要: Fast Sparse 3D Convolution Network with VDB
- arxiv url: http://arxiv.org/abs/2311.02762v2
- Date: Wed, 15 Nov 2023 04:38:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 19:24:51.630448
- Title: Fast Sparse 3D Convolution Network with VDB
- Title(参考訳): VDBを用いた高速スパース3次元畳み込みネットワーク
- Authors: Fangjun Zhou, Anyong Mao, Eftychios Sifakis
- Abstract要約: スパース3次元データ推論に最適化された新しい畳み込みニューラルネットワークの実装を提案する。
この実装では、データ構造としてNanoVDBを使用してスパーステンソルを格納する。
このアーキテクチャは,高解像度3次元オブジェクト分類ネットワーク上での最先端の高密度CNNモデルよりも約20倍高速であることを示す。
- 参考スコア(独自算出の注目度): 2.834312349049142
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We proposed a new Convolution Neural Network implementation optimized for
sparse 3D data inference. This implementation uses NanoVDB as the data
structure to store the sparse tensor. It leaves a relatively small memory
footprint while maintaining high performance. We demonstrate that this
architecture is around 20 times faster than the state-of-the-art dense CNN
model on a high-resolution 3D object classification network.
- Abstract(参考訳): スパース3次元データ推論に最適化された新しい畳み込みニューラルネットワークの実装を提案する。
この実装では、データ構造としてNanoVDBを使用してスパーステンソルを格納する。
パフォーマンスを維持しながら、メモリフットプリントが比較的小さい。
このアーキテクチャは高分解能3dオブジェクト分類ネットワーク上の最先端のcnnモデルよりも約20倍高速であることを示す。
関連論文リスト
- fVDB: A Deep-Learning Framework for Sparse, Large-Scale, and High-Performance Spatial Intelligence [50.417261057533786]
fVDBは、大規模な3Dデータのディープラーニングのための新しいフレームワークである。
私たちのフレームワークは、既存のパイプラインとの相互運用性を可能にするPyTorchと完全に統合されています。
論文 参考訳(メタデータ) (2024-07-01T20:20:33Z) - Using a Waffle Iron for Automotive Point Cloud Semantic Segmentation [66.6890991207065]
スパース3D畳み込みは、ディープニューラルネットワークを構築するためのデファクトツールとなっている。
本稿では,スパース畳み込みを必要とせず,最先端の手法に到達できる方法を提案する。
このような性能のレベルは、大規模かつ高性能な3D知覚に相応しいツールに依存して達成可能であることを示す。
論文 参考訳(メタデータ) (2023-01-24T16:10:08Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - LatticeNet: Fast Spatio-Temporal Point Cloud Segmentation Using
Permutohedral Lattices [27.048998326468688]
深層畳み込みニューラルネットワーク(CNN)は、画像のセグメンテーションに際し、優れた性能を示している。
本稿では,3次元セマンティックセグメンテーションの新たなアプローチであるLatticeNetを提案する。
本稿では,本手法が最先端性能を実現する複数のデータセット上での3次元セグメント化の結果について述べる。
論文 参考訳(メタデータ) (2021-08-09T10:17:27Z) - FuSeConv: Fully Separable Convolutions for Fast Inference on Systolic
Arrays [2.8583189395674653]
本稿では,深度的に分離可能な畳み込みの代替としてFuSeConvを提案する。
FuSeConvは、空間次元と深さ次元に沿って分離可能な1次元の畳み込みを完全に分解する。
我々は、画像Netデータセットに匹敵する精度で、64x64サイズのシストリックアレイ上で、MobileNetのネットワークファミリで3x-7xの大幅な高速化を実現した。
論文 参考訳(メタデータ) (2021-05-27T20:19:39Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - RocNet: Recursive Octree Network for Efficient 3D Deep Representation [3.7298568326039026]
我々のネットワークは任意の大きさのボクセルグリッドをオートエンコーダのようなネットワーク内の非常に小さな潜在空間に圧縮する。
我々は,32,64,128個のグリッドを圧縮して,潜水空間で80個のフロートに圧縮する結果を示した。
論文 参考訳(メタデータ) (2020-08-10T03:02:10Z) - RT3D: Achieving Real-Time Execution of 3D Convolutional Neural Networks
on Mobile Devices [57.877112704841366]
本稿では3次元CNNのためのモデル圧縮およびモバイルアクセラレーションフレームワークRT3Dを提案する。
3D CNNのリアルタイム実行は、市販のモバイル上で初めて実現された。
論文 参考訳(メタデータ) (2020-07-20T02:05:32Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。