論文の概要: RocNet: Recursive Octree Network for Efficient 3D Deep Representation
- arxiv url: http://arxiv.org/abs/2008.03875v1
- Date: Mon, 10 Aug 2020 03:02:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:36:29.399921
- Title: RocNet: Recursive Octree Network for Efficient 3D Deep Representation
- Title(参考訳): RocNet: 効率的な3次元深部表現のための再帰的Ocreeネットワーク
- Authors: Juncheng Liu, Steven Mills, Brendan McCane
- Abstract要約: 我々のネットワークは任意の大きさのボクセルグリッドをオートエンコーダのようなネットワーク内の非常に小さな潜在空間に圧縮する。
我々は,32,64,128個のグリッドを圧縮して,潜水空間で80個のフロートに圧縮する結果を示した。
- 参考スコア(独自算出の注目度): 3.7298568326039026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a deep recursive octree network for the compression of 3D voxel
data. Our network compresses a voxel grid of any size down to a very small
latent space in an autoencoder-like network. We show results for compressing
32, 64 and 128 grids down to just 80 floats in the latent space. We demonstrate
the effectiveness and efficiency of our proposed method on several publicly
available datasets with three experiments: 3D shape classification, 3D shape
reconstruction, and shape generation. Experimental results show that our
algorithm maintains accuracy while consuming less memory with shorter training
times compared to existing methods, especially in 3D reconstruction tasks.
- Abstract(参考訳): 3dボクセルデータの圧縮のために, 深い再帰的octreeネットワークを導入する。
我々のネットワークは任意の大きさのボクセルグリッドをオートエンコーダのようなネットワーク内の非常に小さな潜在空間に圧縮する。
提案手法では,32,64,128個のグリッドを圧縮して80個のフロートに圧縮する。
3次元形状分類, 3次元形状再構成, 形状生成の3つの実験により, 提案手法の有効性と有効性を示す。
実験の結果,従来の3次元復元法に比べて少ないトレーニング時間で少ないメモリを消費しながら,精度を維持していることがわかった。
関連論文リスト
- Fast Sparse 3D Convolution Network with VDB [2.834312349049142]
スパース3次元データ推論に最適化された新しい畳み込みニューラルネットワークの実装を提案する。
この実装では、データ構造としてNanoVDBを使用してスパーステンソルを格納する。
このアーキテクチャは,高解像度3次元オブジェクト分類ネットワーク上での最先端の高密度CNNモデルよりも約20倍高速であることを示す。
論文 参考訳(メタデータ) (2023-11-05T20:43:46Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - ROAD: Learning an Implicit Recursive Octree Auto-Decoder to Efficiently
Encode 3D Shapes [32.267066838654834]
複雑な3次元形状の大規模データセットを効率よく正確に符号化する新しい暗黙表現を提案する。
暗黙的再帰的Octree Auto-Decoder (ROAD) は階層的に構造化された潜在空間を学習し、圧縮比99%以上で最先端の復元結果を実現する。
論文 参考訳(メタデータ) (2022-12-12T19:09:47Z) - Dual Octree Graph Networks for Learning Adaptive Volumetric Shape
Representations [21.59311861556396]
本手法は,3次元形状の体積場を,オクツリーによって構成された適応的特徴量で符号化する。
エンコーダ・デコーダネットワークは、オクツリーノードの二重グラフ上のグラフ畳み込みに基づいて、適応的な特徴量を学ぶように設計されている。
提案手法は, 形状詳細を効果的に符号化し, 高速な3次元形状復元を可能にし, 訓練カテゴリから3次元形状をモデル化するための優れた汎用性を示す。
論文 参考訳(メタデータ) (2022-05-05T17:56:34Z) - Mesh Convolution with Continuous Filters for 3D Surface Parsing [101.25796935464648]
本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T09:16:49Z) - Putting 3D Spatially Sparse Networks on a Diet [21.881294733075393]
本稿では, セマンティックセグメンテーションとインスタンスセグメンテーションのためのコンパクトで空間的にスパースな3Dコンブネット(WS3-ConvNet)を提案する。
我々は、コンパクトネットワークを見つけるために、様々なネットワークプルーニング戦略を採用し、我々のWS3-ConvNetが、最小限の性能損失(2-15%の低下)を、15%少ないパラメータ(1/100の圧縮率)で達成することを示す。
最後に、WS3-ConvNetの圧縮パターンを体系的に解析し、圧縮されたネットワークに共通する興味深いスパシティパターンを示し、推論をさらに高速化する。
論文 参考訳(メタデータ) (2021-12-02T15:20:15Z) - R2U3D: Recurrent Residual 3D U-Net for Lung Segmentation [17.343802171952195]
本稿では,3次元肺分割作業のための新しいモデルであるRecurrent Residual 3D U-Net(R2U3D)を提案する。
特に,提案モデルでは,U-Netに基づくRecurrent Residual Neural Networkに3次元畳み込みを組み込む。
提案するR2U3Dネットワークは、公開データセットLUNA16に基づいてトレーニングされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-05T19:17:14Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion
Forecasting with a Single Convolutional Net [93.51773847125014]
本研究では,3Dセンサが捉えたデータを用いて,3D検出,追跡,動作予測を共同で推論する,新たなディープニューラルネットワークを提案する。
鳥の眼球を3次元の世界として表現し,空間と時間にまたがる3次元畳み込みを行う。
論文 参考訳(メタデータ) (2020-12-22T22:43:35Z) - OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。
本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。
我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文 参考訳(メタデータ) (2020-05-14T17:48:49Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。