論文の概要: Neural Network Modeling of Probabilities for Coding the Octree
Representation of Point Clouds
- arxiv url: http://arxiv.org/abs/2106.06482v2
- Date: Mon, 14 Jun 2021 13:28:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 16:39:54.267179
- Title: Neural Network Modeling of Probabilities for Coding the Octree
Representation of Point Clouds
- Title(参考訳): 点雲のオクター表現符号化における確率のニューラルネットワークモデリング
- Authors: Emre Can Kaya, Ioan Tabus
- Abstract要約: 本稿では,ボクセルの占有状況に対する符号化確率をニューラルネットワークを用いて推定する,新しいポイントクラウド圧縮アルゴリズムについて述べる。
提案したアルゴリズムは、ベンチマークデータセット上で最先端の結果を得る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a novel lossless point cloud compression algorithm that
uses a neural network for estimating the coding probabilities for the occupancy
status of voxels, depending on wide three dimensional contexts around the voxel
to be encoded. The point cloud is represented as an octree, with each
resolution layer being sequentially encoded and decoded using arithmetic
coding, starting from the lowest resolution, until the final resolution is
reached. The occupancy probability of each voxel of the splitting pattern at
each node of the octree is modeled by a neural network, having at its input the
already encoded occupancy status of several octree nodes (belonging to the past
and current resolutions), corresponding to a 3D context surrounding the node to
be encoded. The algorithm has a fast and a slow version, the fast version
selecting differently several voxels of the context, which allows an increased
parallelization by sending larger batches of templates to be estimated by the
neural network, at both encoder and decoder. The proposed algorithms yield
state-of-the-art results on benchmark datasets. The implementation will be made
available at https://github.com/marmus12/nnctx
- Abstract(参考訳): 本稿では,ボクセル周辺の広い3次元の状況に応じて,ボクセルの占有状況の符号化確率をニューラルネットワークを用いて推定する,新しいロスレスポイントクラウド圧縮アルゴリズムについて述べる。
ポイントクラウドはoctreeとして表現され、各解像度層はシーケンシャルにエンコードされ、最下位の解像度から最終解像度に到達するまで算術符号化によってデコードされる。
octreeの各ノードにおける分割パターンの各ボクセルの占有確率はニューラルネットワークによってモデル化され、入力時にエンコードされるノードを取り巻く3dコンテキストに対応する複数のoctreeノードの既にエンコードされた占有状態(過去と現在の解像度)を有する。
アルゴリズムは高速で遅いバージョンを持ち、コンテキストの異なるボクセルを選択する高速バージョンは、エンコーダとデコーダの両方で、ニューラルネットワークによって推定される大きなテンプレートのバッチを送信することで並列化を増加させる。
提案したアルゴリズムは、ベンチマークデータセット上で最先端の結果を得る。
実装はhttps://github.com/marmus12/nnctxで公開される。
関連論文リスト
- HYVE: Hybrid Vertex Encoder for Neural Distance Fields [9.40036617308303]
本稿では,1つの前方パスにおける3次元形状の正確な符号化に適したニューラルネットワークアーキテクチャを提案する。
我々のネットワークは、非ゼロ距離値や形状占有の事前知識を明示することなく、有効な符号付き距離場を出力することができる。
論文 参考訳(メタデータ) (2023-10-10T14:07:37Z) - Learning Neural Volumetric Field for Point Cloud Geometry Compression [13.691147541041804]
我々は、ニューラルネットワークを学習することで、与えられた点雲の幾何学をコーディングすることを提案する。
空間全体を小さな立方体に分割し,各空でない立方体をニューラルネットワークと入力潜時符号で表現する。
ネットワークは、空間的および時間的冗長性を利用するために、1つのフレームまたは複数のフレームで全ての立方体間で共有される。
論文 参考訳(メタデータ) (2022-12-11T19:55:24Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - Lossless Compression of Point Cloud Sequences Using Sequence Optimized
CNN Models [0.0]
そこで,畳み込みニューラルネットワークが符号化分布を推定する点雲列の幾何を符号化する新しいパラダイムを提案する。
我々は軽量なCNN構造を採用し、符号化プロセスの一部としてトレーニングを行い、ビットストリームの一部としてCNNパラメータが送信される。
論文 参考訳(メタデータ) (2022-06-02T20:46:05Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Instant Neural Graphics Primitives with a Multiresolution Hash Encoding [67.33850633281803]
品質を犠牲にすることなく、より小さなネットワークを使用できる汎用的な新しい入力符号化を提案する。
小さなニューラルネットワークは、勾配降下によって値が最適化された訓練可能な特徴ベクトルの多分解能ハッシュテーブルによって拡張される。
数桁の高速化を実現し、高品質なニューラルネットワークプリミティブを数秒でトレーニングすることができる。
論文 参考訳(メタデータ) (2022-01-16T07:22:47Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Lossless Coding of Point Cloud Geometry using a Deep Generative Model [11.69103847045569]
方法は点雲を複数のボクセルブロックサイズに適応的に分割する。
深部自己回帰生成モデルでは、各ボクセルの占有確率を推定する。
我々は,文脈ベースの算術コーダを用いて,ブロックを効率的に符号化する確率を推定する。
論文 参考訳(メタデータ) (2021-07-01T12:20:22Z) - Learning-based lossless compression of 3D point cloud geometry [11.69103847045569]
encoderはハイブリッドモードで動作し、octreeとvoxelベースのコーディングを混合する。
提案手法は,最先端MPEG G-PCC規格を平均28%で上回っている。
論文 参考訳(メタデータ) (2020-11-30T11:27:16Z) - Permute, Quantize, and Fine-tune: Efficient Compression of Neural
Networks [70.0243910593064]
ベクトル量子化の成功の鍵は、どのパラメータ群を一緒に圧縮するかを決定することである。
本稿では,隣り合う2つの層の重みを同じ関数を表現しながら不変にすることができることを観察する。
次に、レート歪み理論への接続を確立し、圧縮し易いネットワークとなる置換を探索する。
論文 参考訳(メタデータ) (2020-10-29T15:47:26Z) - Refinement of Predicted Missing Parts Enhance Point Cloud Completion [62.997667081978825]
点雲完了は、部分的な観測から3次元形状の点集合表現を用いて完全な幾何学を予測するタスクである。
従来のアプローチでは、不完全点集合によって供給されるエンコーダ・デコーダモデルにより、点雲全体を直接推定するニューラルネットワークが提案されていた。
本稿では、欠落した幾何を計算し、既知の入力と予測点クラウドを融合することに焦点を当てたエンドツーエンドニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-08T22:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。