論文の概要: Multiscale deep context modeling for lossless point cloud geometry
compression
- arxiv url: http://arxiv.org/abs/2104.09859v1
- Date: Tue, 20 Apr 2021 09:48:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 13:28:12.698905
- Title: Multiscale deep context modeling for lossless point cloud geometry
compression
- Title(参考訳): ロスレス・ポイント・クラウド幾何圧縮のための多スケール深層文脈モデリング
- Authors: Dat Thanh Nguyen, Maurice Quach, Giuseppe Valenzise, Pierre Duhamel
- Abstract要約: MSVoxelDNNは、点群ジオメトリ圧縮のための深い生成的アプローチです。
これはMPEG G-PCCと比較して大幅に減少する。
- 参考スコア(独自算出の注目度): 11.69103847045569
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a practical deep generative approach for lossless point cloud
geometry compression, called MSVoxelDNN, and show that it significantly reduces
the rate compared to the MPEG G-PCC codec. Our previous work based on
autoregressive models (VoxelDNN) has a fast training phase, however, inference
is slow as the occupancy probabilities are predicted sequentially, voxel by
voxel. In this work, we employ a multiscale architecture which models voxel
occupancy in coarse-to-fine order. At each scale, MSVoxelDNN divides voxels
into eight conditionally independent groups, thus requiring a single network
evaluation per group instead of one per voxel. We evaluate the performance of
MSVoxelDNN on a set of point clouds from Microsoft Voxelized Upper Bodies
(MVUB) and MPEG, showing that the current method speeds up encoding/decoding
times significantly compared to the previous VoxelDNN, while having average
rate saving over G-PCC of 17.5%. The implementation is available at
https://github.com/Weafre/MSVoxelDNN.
- Abstract(参考訳): 我々は,MSVoxelDNNと呼ばれる無損失点雲の幾何圧縮のための実用的な深部生成手法を提案し,MPEG G-PCCコーデックと比較して有意に速度を低下させることを示した。
自己回帰モデル(voxeldnn)に基づくこれまでの研究は,高速なトレーニングフェーズを持つが,voxelによるvoxelのように占有確率が逐次予測されるため,推論は遅くなる。
本研究では,ボクセル占有率を粗い順にモデル化したマルチスケールアーキテクチャを用いる。
各スケールにおいて、MSVoxelDNNはボクセルを8つの条件付き独立グループに分割し、ボクセル毎に1つのネットワーク評価を必要とする。
我々は,Microsoft Voxelized Upper Bodies (MVUB) と MPEG の一連の点群における MSVoxelDNN の性能を評価し,G-PCC よりも平均で17.5% の速度で,従来の VoxelDNN と比較して符号化/復号時間を著しく高速化することを示した。
実装はhttps://github.com/Weafre/MSVoxelDNNで公開されている。
関連論文リスト
- SparseTem: Boosting the Efficiency of CNN-Based Video Encoders by Exploiting Temporal Continuity [15.872209884833977]
本稿では,メモリオーバーヘッドを削減するためのメモリ効率スケジューリング手法と,精度の劣化を最小限に抑えるためのオンライン調整機構を提案する。
SparseTemは効率の良いDetでは1.79x、CRNNでは4.72xの高速化を実現している。
論文 参考訳(メタデータ) (2024-10-28T07:13:25Z) - Dynamic Semantic Compression for CNN Inference in Multi-access Edge
Computing: A Graph Reinforcement Learning-based Autoencoder [82.8833476520429]
部分オフロードにおける効果的な意味抽出と圧縮のための新しい意味圧縮手法であるオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
セマンティックエンコーダでは、CNNのチャネルアテンション機構に基づく特徴圧縮モジュールを導入し、最も情報性の高い特徴を選択して中間データを圧縮する。
セマンティックデコーダでは、受信した圧縮データから学習して中間データを再構築し、精度を向上させる軽量デコーダを設計する。
論文 参考訳(メタデータ) (2024-01-19T15:19:47Z) - NIRVANA: Neural Implicit Representations of Videos with Adaptive
Networks and Autoregressive Patch-wise Modeling [37.51397331485574]
Inlicit Neural Representations (INR)は、最近、高品質なビデオ圧縮のための強力なツールであることが示されている。
これらの手法は、より長いビデオや高解像度にスケールしない固定されたアーキテクチャを持つ。
我々は,動画をフレーム群として扱うNIRVANAを提案し,パッチワイズ予測を行うグループ毎に個別のネットワークを適合させる。
論文 参考訳(メタデータ) (2022-12-30T08:17:02Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - Neighbourhood Representative Sampling for Efficient End-to-end Video
Quality Assessment [60.57703721744873]
リアルタイムビデオの高解像度化は、VQA(Deep Video Quality Assessment)の効率性と精度のジレンマを示す
そこで本研究では,空間時空間格子型ミニキューブサンプリング(St-GMS)を統一的に提案し,新しいタイプのフラグメントを抽出する。
フラグメントとFANetにより、提案された効率的なエンドツーエンドのFAST-VQAとFasterVQAは、既存のVQAベンチマークよりも大幅にパフォーマンスが向上した。
論文 参考訳(メタデータ) (2022-10-11T11:38:07Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Compact representations of convolutional neural networks via weight
pruning and quantization [63.417651529192014]
本稿では、音源符号化に基づく畳み込みニューラルネットワーク(CNN)の新しいストレージフォーマットを提案し、重み付けと量子化の両方を活用する。
我々は、全接続層で0.6%、ネットワーク全体で5.44%のスペース占有率を削減し、最低でもベースラインと同じくらいの競争力を発揮する。
論文 参考訳(メタデータ) (2021-08-28T20:39:54Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z) - Learning-based lossless compression of 3D point cloud geometry [11.69103847045569]
encoderはハイブリッドモードで動作し、octreeとvoxelベースのコーディングを混合する。
提案手法は,最先端MPEG G-PCC規格を平均28%で上回っている。
論文 参考訳(メタデータ) (2020-11-30T11:27:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。