論文の概要: Deep Implicit Volume Compression
- arxiv url: http://arxiv.org/abs/2005.08877v1
- Date: Mon, 18 May 2020 16:46:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-01 23:20:52.545985
- Title: Deep Implicit Volume Compression
- Title(参考訳): 奥深い暗黙のボリューム圧縮
- Authors: Danhang Tang and Saurabh Singh and Philip A. Chou and Christian Haene
and Mingsong Dou and Sean Fanello and Jonathan Taylor and Philip Davidson and
Onur G. Guleryuz and Yinda Zhang and Shahram Izadi and Andrea Tagliasacchi
and Sofien Bouaziz and Cem Keskin
- Abstract要約: 本稿では,3次元ボクセル格子に格納された切り離された符号付き距離場を圧縮する新しい手法について述べる。
我々の手法は、エンドツーエンドで訓練されたブロックベースのニューラルネットワークアーキテクチャに依存し、最先端の速度歪みトレードオフを実現する。
- 参考スコア(独自算出の注目度): 33.81053554523246
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We describe a novel approach for compressing truncated signed distance fields
(TSDF) stored in 3D voxel grids, and their corresponding textures. To compress
the TSDF, our method relies on a block-based neural network architecture
trained end-to-end, achieving state-of-the-art rate-distortion trade-off. To
prevent topological errors, we losslessly compress the signs of the TSDF, which
also upper bounds the reconstruction error by the voxel size. To compress the
corresponding texture, we designed a fast block-based UV parameterization,
generating coherent texture maps that can be effectively compressed using
existing video compression algorithms. We demonstrate the performance of our
algorithms on two 4D performance capture datasets, reducing bitrate by 66% for
the same distortion, or alternatively reducing the distortion by 50% for the
same bitrate, compared to the state-of-the-art.
- Abstract(参考訳): 本稿では,3次元ボクセル格子に格納されたTSDF(truncated signed distance field)の圧縮手法とそのテクスチャについて述べる。
TSDFを圧縮するには、ブロックベースのニューラルネットワークアーキテクチャをエンドツーエンドで訓練し、最先端の速度歪みトレードオフを実現する。
トポロジカルエラーを防止するため, TSDFの符号を無作為に圧縮した。
対応するテクスチャを圧縮するために,既存のビデオ圧縮アルゴリズムを用いて効果的に圧縮可能なコヒーレントテクスチャマップを生成する高速ブロックベースのUVパラメータ化を設計した。
2つの4dパフォーマンスキャプチャデータセットにおけるアルゴリズムの性能を実証し、同じ歪みに対してビットレートを66%削減するか、あるいは同じビットレートで50%削減するかを、最先端と比較した。
関連論文リスト
- Mesh Compression with Quantized Neural Displacement Fields [31.316999947745614]
入射神経表現(INR)は様々な3次元表面表現の圧縮に成功している。
本研究は,INRを用いて3次元トライアングルメッシュを圧縮する簡易かつ効果的な手法を提案する。
本研究では, 複雑なテクスチャの保存が可能であり, 圧縮比が4倍から380倍であることを示す。
論文 参考訳(メタデータ) (2025-03-28T13:35:32Z) - Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。
本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。
我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2025-03-27T13:01:53Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Point Cloud Compression with Bits-back Coding [32.9521748764196]
本稿では,深層学習に基づく確率モデルを用いて,点雲情報のシャノンエントロピーを推定する。
点雲データセットのエントロピーを推定すると、学習されたCVAEモデルを用いて点雲の幾何学的属性を圧縮する。
本手法の新規性は,CVAEの学習潜在変数モデルを用いて点雲データを圧縮することである。
論文 参考訳(メタデータ) (2024-10-09T06:34:48Z) - Map-Assisted Remote-Sensing Image Compression at Extremely Low Bitrates [47.47031054057152]
生成モデルはRS画像を極低ビットレートストリームに圧縮するために研究されている。
これらの生成モデルは、非常に低ビットレート画像圧縮の極めて不適切な性質のため、視覚的に可視な画像の再構成に苦慮している。
本研究では,高現実性再構築を実現するために,自然画像に先行した事前学習拡散モデルを用いた画像圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-03T14:29:54Z) - Neural Graphics Texture Compression Supporting Random Access [34.974631096947284]
本稿では,従来のGPUテクスチャ表現とNIC技術を統合したテクスチャセット圧縮手法を提案する。
本稿では、畳み込みエンコーダを用いた非対称自動エンコーダフレームワークを提案する。
実験により,従来のテクスチャ圧縮よりも優れた結果が得られた。
論文 参考訳(メタデータ) (2024-05-06T19:44:13Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Modeling Image Quantization Tradeoffs for Optimal Compression [0.0]
ロスシー圧縮アルゴリズムは、圧縮率を上げるために高周波データを定量化することでトレードオフを狙う。
本稿では,Deep Learningとminimax損失関数を用いた量子化テーブルの最適化手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T07:35:22Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。
本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。
我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文 参考訳(メタデータ) (2020-05-14T17:48:49Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。