論文の概要: DeepCompress: Efficient Point Cloud Geometry Compression
- arxiv url: http://arxiv.org/abs/2106.01504v1
- Date: Wed, 2 Jun 2021 23:18:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 16:23:03.485642
- Title: DeepCompress: Efficient Point Cloud Geometry Compression
- Title(参考訳): DeepCompress: 効率的なポイントクラウドジオメトリ圧縮
- Authors: Ryan Killea, Yun Li, Saeed Bastani, Paul McLachlan
- Abstract要約: 本稿では,ポイントクラウド圧縮のためのより効率的なディープラーニングベースのエンコーダアーキテクチャを提案する。
CENIC(Efficient Neural Image Compression)から学習した活性化関数を組み込むことで,効率と性能が劇的に向上することを示す。
提案手法は,BjontegardデルタレートとPSNR値において,ベースラインアプローチよりも小さなマージンで優れていた。
- 参考スコア(独自算出の注目度): 1.808877001896346
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Point clouds are a basic data type that is increasingly of interest as 3D
content becomes more ubiquitous. Applications using point clouds include
virtual, augmented, and mixed reality and autonomous driving. We propose a more
efficient deep learning-based encoder architecture for point clouds compression
that incorporates principles from established 3D object detection and image
compression architectures. Through an ablation study, we show that
incorporating the learned activation function from Computational Efficient
Neural Image Compression (CENIC) and designing more parameter-efficient
convolutional blocks yields dramatic gains in efficiency and performance. Our
proposed architecture incorporates Generalized Divisive Normalization
activations and propose a spatially separable InceptionV4-inspired block. We
then evaluate rate-distortion curves on the standard JPEG Pleno 8i Voxelized
Full Bodies dataset to evaluate our model's performance. Our proposed
modifications outperform the baseline approaches by a small margin in terms of
Bjontegard delta rate and PSNR values, yet reduces necessary encoder
convolution operations by 8 percent and reduces total encoder parameters by 20
percent. Our proposed architecture, when considered on its own, has a small
penalty of 0.02 percent in Chamfer's Distance and 0.32 percent increased bit
rate in Point to Plane Distance for the same peak signal-to-noise ratio.
- Abstract(参考訳): ポイントクラウドは基本的なデータ型であり、3dコンテンツがよりユビキタスになるにつれてますます関心を集めている。
ポイントクラウドを使用するアプリケーションは、仮想、拡張現実、複合現実と自律運転を含む。
本稿では,既存の3次元オブジェクト検出および画像圧縮アーキテクチャの原理を取り入れた,点雲圧縮のためのより効率的なディープラーニングベースのエンコーダアーキテクチャを提案する。
本研究では,計算効率の高いニューラルネットワーク圧縮(cenic)から学習した活性化関数を取り入れ,よりパラメータ効率の高い畳み込みブロックを設計することで,効率と性能が劇的に向上することを示す。
提案するアーキテクチャは一般化された分割正規化活性化を取り入れ、空間分離可能なインセプションv4インスパイアドブロックを提案する。
次に、標準JPEG Pleno 8i Voxelized Full Bodiesデータセットの速度歪み曲線を評価し、モデルの性能を評価する。
提案手法は,BjontegardデルタレートとPSNR値において,ベースラインアプローチよりも小さなマージンで優れているが,必要なエンコーダ畳み込み操作を8%削減し,総エンコーダパラメータを20%削減する。
提案するアーキテクチャは, 単独で考えると, シャムファー距離0.02パーセントの小さなペナルティと, 同じピーク信号対雑音比で, 点から平面距離へのビットレート 0.32 % の増大である。
関連論文リスト
- PIVOT-Net: Heterogeneous Point-Voxel-Tree-based Framework for Point
Cloud Compression [8.778300313732027]
異種クラウド圧縮(PCC)フレームワークを提案する。
私たちは、典型的なポイントクラウド表現 -- ポイントベース、ボクセルベース、ツリーベース表現 -- と関連するバックボーンを統一します。
本稿では,デコードのためのコンテキスト対応アップサンプリングと,機能集約のための拡張ボクセルトランスフォーマーによりフレームワークを増強する。
論文 参考訳(メタデータ) (2024-02-11T16:57:08Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - GQE-Net: A Graph-based Quality Enhancement Network for Point Cloud Color
Attribute [51.4803148196217]
本稿では,点雲の色歪みを低減するため,グラフベースの品質向上ネットワーク(GQE-Net)を提案する。
GQE-Netは、幾何学情報を補助入力とグラフ畳み込みブロックとして使用し、局所的な特徴を効率的に抽出する。
実験結果から,本手法は最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2023-03-24T02:33:45Z) - PointPatchMix: Point Cloud Mixing with Patch Scoring [58.58535918705736]
我々は、パッチレベルでポイントクラウドを混合し、混合ポイントクラウドのコンテンツベースターゲットを生成するPointPatchMixを提案する。
パッチスコアリングモジュールは、事前学習した教師モデルから、コンテンツに基づく重要度スコアに基づいて目標を割り当てる。
Point-MAE をベースラインとして,ScanObjectNN では86.3%,ModelNet40 では94.1% の精度で,従来の手法をかなり上回りました。
論文 参考訳(メタデータ) (2023-03-12T14:49:42Z) - Lossless Point Cloud Geometry and Attribute Compression Using a Learned
Conditional Probability Model [0.0]
本稿では,テンソルに基づく深層ニューラルネットワークを用いて,点雲の幾何と色確率を学習する効率的な点雲圧縮法を提案する。
本手法は,異なるビット深さの3つの特徴を持つ点雲を統一表現で表現する。
論文 参考訳(メタデータ) (2023-03-11T23:50:02Z) - 4DAC: Learning Attribute Compression for Dynamic Point Clouds [37.447460254690135]
動的点雲の属性(例えば色)圧縮について検討し、4DACと呼ばれる学習ベースのフレームワークを提案する。
データ内の時間的冗長性を低減するため,まず深層ニューラルネットワークを用いた3次元動き推定と動き補償モジュールを構築した。
さらに,変換係数の確率分布を推定する条件付きエントロピーモデルを提案する。
論文 参考訳(メタデータ) (2022-04-25T15:30:06Z) - Variable Rate Compression for Raw 3D Point Clouds [5.107705550575662]
そこで本研究では,生の3Dポイントクラウドデータを用いた新しい可変レート深部圧縮アーキテクチャを提案する。
我々のネットワークは、ポイントクラウドを明示的に処理し、圧縮された記述を生成することができる。
論文 参考訳(メタデータ) (2022-02-28T15:15:39Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Lightweight Compression of Intermediate Neural Network Features for
Collaborative Intelligence [32.03465747357384]
協調インテリジェンスアプリケーションでは、ディープニューラルネットワーク(DNN)の一部が携帯電話やエッジデバイスなどの軽量デバイスにデプロイされます。
本稿では,分割DNNの中間層によって出力される特徴を量子化し圧縮する,新しい軽量圧縮技術を提案する。
論文 参考訳(メタデータ) (2021-05-15T00:10:12Z) - Reduced Reference Perceptual Quality Model and Application to Rate
Control for 3D Point Cloud Compression [61.110938359555895]
レート歪み最適化では、ビットレートの制約を受ける再構成品質尺度を最大化してエンコーダ設定を決定する。
本稿では,V-PCC幾何および色量化パラメータを変数とする線形知覚品質モデルを提案する。
400個の圧縮された3D点雲による主観的品質試験の結果,提案モデルが平均評価値とよく相関していることが示唆された。
また、同じ目標ビットレートに対して、提案モデルに基づくレート歪みの最適化は、ポイント・ツー・ポイントの客観的な品質指標による徹底的な探索に基づくレート歪みの最適化よりも高い知覚品質を提供することを示した。
論文 参考訳(メタデータ) (2020-11-25T12:42:02Z) - OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。
本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。
我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文 参考訳(メタデータ) (2020-05-14T17:48:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。