論文の概要: Lossless Compression of Point Cloud Sequences Using Sequence Optimized
CNN Models
- arxiv url: http://arxiv.org/abs/2206.01297v1
- Date: Thu, 2 Jun 2022 20:46:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-06 15:31:20.080696
- Title: Lossless Compression of Point Cloud Sequences Using Sequence Optimized
CNN Models
- Title(参考訳): シーケンス最適化cnnモデルを用いた点雲列のロスレス圧縮
- Authors: Emre Can Kaya and Ioan Tabus
- Abstract要約: そこで,畳み込みニューラルネットワークが符号化分布を推定する点雲列の幾何を符号化する新しいパラダイムを提案する。
我々は軽量なCNN構造を採用し、符号化プロセスの一部としてトレーニングを行い、ビットストリームの一部としてCNNパラメータが送信される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a new paradigm for encoding the geometry of point cloud sequences,
where the convolutional neural network (CNN) which estimates the encoding
distributions is optimized on several frames of the sequence to be compressed.
We adopt lightweight CNN structures, we perform training as part of the
encoding process, and the CNN parameters are transmitted as part of the
bitstream. The newly proposed encoding scheme operates on the octree
representation for each point cloud, encoding consecutively each octree
resolution layer. At every octree resolution layer, the voxel grid is traversed
section-by-section (each section being perpendicular to a selected coordinate
axis) and in each section the occupancies of groups of two-by-two voxels are
encoded at once, in a single arithmetic coding operation. A context for the
conditional encoding distribution is defined for each two-by-two group of
voxels, based on the information available about the occupancy of neighbor
voxels in the current and lower resolution layers of the octree. The CNN
estimates the probability distributions of occupancy patterns of all voxel
groups from one section in four phases. In each new phase the contexts are
updated with the occupancies encoded in the previous phase, and each phase
estimates the probabilities in parallel, providing a reasonable trade-off
between the parallelism of processing and the informativeness of the contexts.
The CNN training time is comparable to the time spent in the remaining encoding
steps, leading to competitive overall encoding times. Bitrates and
encoding-decoding times compare favorably with those of recently published
compression schemes.
- Abstract(参考訳): そこで我々は, 圧縮対象の列の複数のフレームに対して, 符号化分布を推定する畳み込みニューラルネットワーク(CNN)を最適化する, 点雲列の幾何を符号化する新しいパラダイムを提案する。
我々は軽量なCNN構造を採用し、符号化プロセスの一部としてトレーニングを行い、ビットストリームの一部としてCNNパラメータが送信される。
新たに提案されたエンコーディング方式は、各ポイントクラウドのoctree表現上で動作し、各octree解決層を連続してエンコードする。
各オクツリー分解層において、ボクセルグリッドを断面(各区間は選択された座標軸に垂直)にトラバースし、各区間では2対2のボクセルのグループの占有を1つの算術符号演算で同時に符号化する。
オクツリーの現在の解像度層と低い解像度層における隣接するボクセルの占有状況に関する情報に基づいて、2つのボクセル群毎に条件符号化分布のコンテキストを定義する。
CNNは、全てのボクセル群の占有パターンの確率分布を4つのフェーズで1つのセクションから推定する。
新しいフェーズごとに、コンテキストは前フェーズでエンコードされた占有率で更新され、各フェーズは並列に確率を推定し、並列処理とコンテキストのインフォメーションの間の合理的なトレードオフを提供する。
CNNのトレーニング時間は、残りのエンコーディングステップで費やされた時間に匹敵する。
ビットレートと符号化復号時間は、最近公開された圧縮スキームと好適に比較される。
関連論文リスト
- High-Efficiency Neural Video Compression via Hierarchical Predictive Learning [27.41398149573729]
強化されたDeep Hierarchical Video Compression(DHVC 2.0)は、優れた圧縮性能と目覚ましい複雑さの効率を導入する。
階層的な予測符号化を使用して、各ビデオフレームをマルチスケール表現に変換する。
トランスミッションフレンドリーなプログレッシブデコーディングをサポートしており、パケットロスの存在下では特にネットワーク化されたビデオアプリケーションに有利である。
論文 参考訳(メタデータ) (2024-10-03T15:40:58Z) - PINs: Progressive Implicit Networks for Multi-Scale Neural
Representations [68.73195473089324]
周波数符号化のインクリメンタルな集合に階層構造を露出するプログレッシブな位置符号化を提案する。
本モデルでは,広帯域のシーンを正確に再構成し,プログレッシブなディテールでシーン表現を学習する。
いくつかの2次元および3次元データセットの実験では、ベースラインと比較して、再構築精度、表現能力、トレーニング速度が改善されている。
論文 参考訳(メタデータ) (2022-02-09T20:33:37Z) - End-to-end Neural Video Coding Using a Compound Spatiotemporal
Representation [33.54844063875569]
本稿では,2つの手法により生成された予測を適応的に組み合わせたハイブリッド動作補償法を提案する。
具体的には、リカレント情報集約(RIA)モジュールを用いて、複合時間表現(STR)を生成する。
さらに、ベクトルベースの再サンプリング、適応カーネルベースの再サンプリング、補償モード選択マップ、テクスチャ拡張を含む、CSTRから複数の予測を生成する1対多デコーダパイプラインを設計する。
論文 参考訳(メタデータ) (2021-08-05T19:43:32Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Improved CNN-based Learning of Interpolation Filters for Low-Complexity
Inter Prediction in Video Coding [5.46121027847413]
本稿では,ニューラルネットワークを用いた新しい予測手法を提案する。
新たなトレーニングフレームワークにより、各ネットワークブランチは特定の分数シフトに類似することができる。
Versatile Video Coding (VVC)テストモデルで実装されると、0.77%、1.27%、および2.25%のBDレートの節約が達成される。
論文 参考訳(メタデータ) (2021-06-16T16:48:01Z) - Neural Network Modeling of Probabilities for Coding the Octree
Representation of Point Clouds [0.0]
本稿では,ボクセルの占有状況に対する符号化確率をニューラルネットワークを用いて推定する,新しいポイントクラウド圧縮アルゴリズムについて述べる。
提案したアルゴリズムは、ベンチマークデータセット上で最先端の結果を得る。
論文 参考訳(メタデータ) (2021-06-11T16:07:46Z) - Context- and Sequence-Aware Convolutional Recurrent Encoder for Neural
Machine Translation [2.729898906885749]
既存のモデルは、エンコーダとデコーダモジュールを構築するためにリカレントニューラルネットワークを使用する。
代替研究では、入力文の構文構造をキャプチャするために畳み込みニューラルネットワークによって繰り返しネットワークが置き換えられた。
コンテクスト情報を取得するための畳み込み再帰エンコーダを提案することにより,両手法の利点を取り入れた。
論文 参考訳(メタデータ) (2021-01-11T17:03:52Z) - Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective
with Transformers [149.78470371525754]
セマンティックセグメンテーションをシーケンスからシーケンスへの予測タスクとして扱う。
具体的には、イメージをパッチのシーケンスとしてエンコードするために純粋なトランスをデプロイします。
トランスのすべての層でモデル化されたグローバルコンテキストにより、このエンコーダは、SETR(SEgmentation TRansformer)と呼ばれる強力なセグメンテーションモデルを提供するための単純なデコーダと組み合わせることができる。
SETRはADE20K(50.28% mIoU)、Pascal Context(55.83% mIoU)、およびCityscapesの競争力のある結果に関する最新技術を達成している。
論文 参考訳(メタデータ) (2020-12-31T18:55:57Z) - Permute, Quantize, and Fine-tune: Efficient Compression of Neural
Networks [70.0243910593064]
ベクトル量子化の成功の鍵は、どのパラメータ群を一緒に圧縮するかを決定することである。
本稿では,隣り合う2つの層の重みを同じ関数を表現しながら不変にすることができることを観察する。
次に、レート歪み理論への接続を確立し、圧縮し易いネットワークとなる置換を探索する。
論文 参考訳(メタデータ) (2020-10-29T15:47:26Z) - Implicit Convex Regularizers of CNN Architectures: Convex Optimization
of Two- and Three-Layer Networks in Polynomial Time [70.15611146583068]
本稿では,ReLUアクティベーションを用いた畳み込みニューラルネットワーク(CNN)のトレーニングについて検討する。
我々は,データサンプル数,ニューロン数,データ次元に関して,厳密な凸最適化を導入する。
論文 参考訳(メタデータ) (2020-06-26T04:47:20Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。