論文の概要: Deep Implicit Volume Compression
- arxiv url: http://arxiv.org/abs/2005.08877v1
- Date: Mon, 18 May 2020 16:46:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 23:20:52.545985
- Title: Deep Implicit Volume Compression
- Title(参考訳): 奥深い暗黙のボリューム圧縮
- Authors: Danhang Tang and Saurabh Singh and Philip A. Chou and Christian Haene
and Mingsong Dou and Sean Fanello and Jonathan Taylor and Philip Davidson and
Onur G. Guleryuz and Yinda Zhang and Shahram Izadi and Andrea Tagliasacchi
and Sofien Bouaziz and Cem Keskin
- Abstract要約: 本稿では,3次元ボクセル格子に格納された切り離された符号付き距離場を圧縮する新しい手法について述べる。
我々の手法は、エンドツーエンドで訓練されたブロックベースのニューラルネットワークアーキテクチャに依存し、最先端の速度歪みトレードオフを実現する。
- 参考スコア(独自算出の注目度): 33.81053554523246
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We describe a novel approach for compressing truncated signed distance fields
(TSDF) stored in 3D voxel grids, and their corresponding textures. To compress
the TSDF, our method relies on a block-based neural network architecture
trained end-to-end, achieving state-of-the-art rate-distortion trade-off. To
prevent topological errors, we losslessly compress the signs of the TSDF, which
also upper bounds the reconstruction error by the voxel size. To compress the
corresponding texture, we designed a fast block-based UV parameterization,
generating coherent texture maps that can be effectively compressed using
existing video compression algorithms. We demonstrate the performance of our
algorithms on two 4D performance capture datasets, reducing bitrate by 66% for
the same distortion, or alternatively reducing the distortion by 50% for the
same bitrate, compared to the state-of-the-art.
- Abstract(参考訳): 本稿では,3次元ボクセル格子に格納されたTSDF(truncated signed distance field)の圧縮手法とそのテクスチャについて述べる。
TSDFを圧縮するには、ブロックベースのニューラルネットワークアーキテクチャをエンドツーエンドで訓練し、最先端の速度歪みトレードオフを実現する。
トポロジカルエラーを防止するため, TSDFの符号を無作為に圧縮した。
対応するテクスチャを圧縮するために,既存のビデオ圧縮アルゴリズムを用いて効果的に圧縮可能なコヒーレントテクスチャマップを生成する高速ブロックベースのUVパラメータ化を設計した。
2つの4dパフォーマンスキャプチャデータセットにおけるアルゴリズムの性能を実証し、同じ歪みに対してビットレートを66%削減するか、あるいは同じビットレートで50%削減するかを、最先端と比較した。
関連論文リスト
- Point Cloud Compression with Bits-back Coding [32.9521748764196]
本稿では,深層学習に基づく確率モデルを用いて,点雲情報のシャノンエントロピーを推定する。
点雲データセットのエントロピーを推定すると、学習されたCVAEモデルを用いて点雲の幾何学的属性を圧縮する。
本手法の新規性は,CVAEの学習潜在変数モデルを用いて点雲データを圧縮することである。
論文 参考訳(メタデータ) (2024-10-09T06:34:48Z) - Map-Assisted Remote-Sensing Image Compression at Extremely Low Bitrates [47.47031054057152]
生成モデルはRS画像を極低ビットレートストリームに圧縮するために研究されている。
これらの生成モデルは、非常に低ビットレート画像圧縮の極めて不適切な性質のため、視覚的に可視な画像の再構成に苦慮している。
本研究では,高現実性再構築を実現するために,自然画像に先行した事前学習拡散モデルを用いた画像圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-03T14:29:54Z) - Neural Graphics Texture Compression Supporting Random Access [34.974631096947284]
本稿では,従来のGPUテクスチャ表現とNIC技術を統合したテクスチャセット圧縮手法を提案する。
本稿では、畳み込みエンコーダを用いた非対称自動エンコーダフレームワークを提案する。
実験により,従来のテクスチャ圧縮よりも優れた結果が得られた。
論文 参考訳(メタデータ) (2024-05-06T19:44:13Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Modeling Image Quantization Tradeoffs for Optimal Compression [0.0]
ロスシー圧縮アルゴリズムは、圧縮率を上げるために高周波データを定量化することでトレードオフを狙う。
本稿では,Deep Learningとminimax損失関数を用いた量子化テーブルの最適化手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T07:35:22Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。
本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。
我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文 参考訳(メタデータ) (2020-05-14T17:48:49Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。