論文の概要: Exploring Autoencoder-based Error-bounded Compression for Scientific
Data
- arxiv url: http://arxiv.org/abs/2105.11730v7
- Date: Sat, 21 Oct 2023 22:26:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-28 07:27:32.165380
- Title: Exploring Autoencoder-based Error-bounded Compression for Scientific
Data
- Title(参考訳): 科学データのためのオートエンコーダベースエラーバウンド圧縮の検討
- Authors: Jinyang Liu, Sheng Di, Kai Zhao, Sian Jin, Dingwen Tao, Xin Liang,
Zizhong Chen, Franck Cappello
- Abstract要約: 我々は,SZモデルの観点から,エラーバウンドオートエンコーダベースのフレームワークを開発する。
設計したAEベースエラーバウンド圧縮フレームワークの主段の圧縮品質を最適化する。
- 参考スコア(独自算出の注目度): 14.724393511470225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Error-bounded lossy compression is becoming an indispensable technique for
the success of today's scientific projects with vast volumes of data produced
during simulations or instrument data acquisitions. Not only can it
significantly reduce data size, but it also can control the compression errors
based on user-specified error bounds. Autoencoder (AE) models have been widely
used in image compression, but few AE-based compression approaches support
error-bounding features, which are highly required by scientific applications.
To address this issue, we explore using convolutional autoencoders to improve
error-bounded lossy compression for scientific data, with the following three
key contributions. (1) We provide an in-depth investigation of the
characteristics of various autoencoder models and develop an error-bounded
autoencoder-based framework in terms of the SZ model. (2) We optimize the
compression quality for the main stages in our designed AE-based error-bounded
compression framework, fine-tuning the block sizes and latent sizes and also
optimizing the compression efficiency of latent vectors. (3) We evaluate our
proposed solution using five real-world scientific datasets and compare them
with six other related works. Experiments show that our solution exhibits a
very competitive compression quality among all the compressors in our tests. In
absolute terms, it can obtain a much better compression quality (100% ~ 800%
improvement in compression ratio with the same data distortion) compared with
SZ2.1 and ZFP in cases with a high compression ratio.
- Abstract(参考訳): シミュレーションやインスツルメンテーションデータ取得中に大量のデータが生成された今日の科学プロジェクトの成功には、エラーバウンドのロスイット圧縮が不可欠のテクニックになりつつある。
データサイズを大幅に削減できるだけでなく、ユーザ指定のエラー境界に基づいて圧縮エラーを制御することもできる。
オートエンコーダ (AE) モデルは画像圧縮に広く用いられているが、AEベースの圧縮アプローチはほとんどエラーバウンド機能をサポートしていない。
この問題に対処するために,convolutional autoencoderを使用して,科学的データに対するエラーバウンド損失圧縮を改善する。
1) 様々なオートエンコーダモデルの特徴を詳細に検討し, szモデルを用いて誤差境界付きオートエンコーダベースのフレームワークを開発した。
2)本設計したaeベースエラーバウンド圧縮フレームワークのメインステージの圧縮品質を最適化し,ブロックサイズと潜在サイズを微調整するとともに,潜在ベクトルの圧縮効率を最適化する。
3) 5つの実世界科学データセットを用いて提案手法を評価し,他の6つの関連作品と比較した。
実験の結果, コンプレッサの圧縮性能は, コンプレッサの圧縮性能に比較して非常に高いことがわかった。
絶対的な言い方をすれば、圧縮比が高い場合、SZ2.1やZFPと比較して、圧縮品質(圧縮比が100%から800%向上している)がはるかに良い。
関連論文リスト
- Sparse $L^1$-Autoencoders for Scientific Data Compression [0.0]
L1$-regularizedの高次元ラテント空間を用いたオートエンコーダの開発により,効率的なデータ圧縮手法を提案する。
本稿では,これらの情報に富む潜伏空間を用いて,ぼやけなどのアーティファクトを緩和し,科学的データに対する高効率なデータ圧縮手法を実現する方法について述べる。
論文 参考訳(メタデータ) (2024-05-23T07:48:00Z) - Compression of Structured Data with Autoencoders: Provable Benefit of
Nonlinearities and Depth [83.15263499262824]
勾配勾配勾配は入力のスパース構造を完全に無視する解に収束することを示す。
浅層構造にデノナイジング関数を付加することにより,スパースデータの圧縮におけるガウス性能の改善方法を示す。
CIFAR-10 や MNIST などの画像データセットに対して,本研究の成果を検証した。
論文 参考訳(メタデータ) (2024-02-07T16:32:29Z) - Activations and Gradients Compression for Model-Parallel Training [85.99744701008802]
モデル並列分散トレーニングセットアップにおけるアクティベーションと勾配の同時圧縮が収束に与える影響について検討する。
グラデーションはアクティベーションよりも軽度な圧縮速度を必要とする。
実験では、TopKでトレーニングされたモデルが、推論中に圧縮も適用された場合にのみ正常に動作することが示されている。
論文 参考訳(メタデータ) (2024-01-15T15:54:54Z) - SRN-SZ: Deep Leaning-Based Scientific Error-bounded Lossy Compression
with Super-resolution Neural Networks [13.706955134941385]
本研究では,SRN-SZを提案する。
SRN-SZはその圧縮に最も高度な超解像ネットワークHATを適用している。
実験では、SRN-SZは最大75%の圧縮比の改善を同じ誤差境界下で達成する。
論文 参考訳(メタデータ) (2023-09-07T22:15:32Z) - Hierarchical Autoencoder-based Lossy Compression for Large-scale High-resolution Scientific Data [12.831138965071945]
この研究は、大規模な科学的データを著しく圧縮するニューラルネットワークを提示するが、高い再構成品質も維持する。
提案モデルは,大規模高分解能気候モデルデータセットに適用可能な科学ベンチマークデータを用いて検証した。
本モデルでは,再構成品質を損なうことなく,複数のベンチマークデータセットに対して140の圧縮比を達成している。
論文 参考訳(メタデータ) (2023-07-09T16:11:02Z) - Scalable Hybrid Learning Techniques for Scientific Data Compression [6.803722400888276]
科学者は、抽出された興味の量(QoIs)を正確に保存する圧縮技術を必要とする
本稿では,データ圧縮のためのエンドツーエンドでスケーラブルなGPUベースのパイプラインとして実装された物理インフォームド圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-12-21T03:00:18Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。