論文の概要: AstroCompress: A benchmark dataset for multi-purpose compression of astronomical data
- arxiv url: http://arxiv.org/abs/2506.08306v1
- Date: Tue, 10 Jun 2025 00:32:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:40.955948
- Title: AstroCompress: A benchmark dataset for multi-purpose compression of astronomical data
- Title(参考訳): AstroCompress: 天文データの多目的圧縮のためのベンチマークデータセット
- Authors: Tuan Truong, Rithwik Sudharsan, Yibo Yang, Peter Xiangyuan Ma, Ruihan Yang, Stephan Mandt, Joshua S. Bloom,
- Abstract要約: 本稿では、天体物理学データに対するニューラル圧縮問題であるAstroCompressを紹介する。
我々はデータに容易にアクセスでき、7つのロスレス圧縮手法をベンチマークするコードを提供します。
以上の結果から,ロスレスニューラルネットワーク技術は観測所におけるデータ収集を向上する可能性が示唆された。
- 参考スコア(独自算出の注目度): 31.271365337613606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The site conditions that make astronomical observatories in space and on the ground so desirable -- cold and dark -- demand a physical remoteness that leads to limited data transmission capabilities. Such transmission limitations directly bottleneck the amount of data acquired and in an era of costly modern observatories, any improvements in lossless data compression has the potential scale to billions of dollars worth of additional science that can be accomplished on the same instrument. Traditional lossless methods for compressing astrophysical data are manually designed. Neural data compression, on the other hand, holds the promise of learning compression algorithms end-to-end from data and outperforming classical techniques by leveraging the unique spatial, temporal, and wavelength structures of astronomical images. This paper introduces AstroCompress: a neural compression challenge for astrophysics data, featuring four new datasets (and one legacy dataset) with 16-bit unsigned integer imaging data in various modes: space-based, ground-based, multi-wavelength, and time-series imaging. We provide code to easily access the data and benchmark seven lossless compression methods (three neural and four non-neural, including all practical state-of-the-art algorithms). Our results on lossless compression indicate that lossless neural compression techniques can enhance data collection at observatories, and provide guidance on the adoption of neural compression in scientific applications. Though the scope of this paper is restricted to lossless compression, we also comment on the potential exploration of lossy compression methods in future studies.
- Abstract(参考訳): 宇宙や地上の天体観測を非常に望ましい ― 寒さと暗さ ― にしている場所の状況は、データ送信能力の制限につながる物理的リモート性を必要としている。
このような送信制限は、取得したデータの量を直接ボトルネックにし、コストのかかる近代的な観測の時代には、損失のないデータ圧縮の改善は、同じ機器で達成できる数十億ドル以上の追加科学に潜在的にスケールする可能性がある。
従来の物理データを圧縮するための損失のない方法は手動で設計されている。
一方、ニューラルデータ圧縮は、データからエンドツーエンドの学習圧縮アルゴリズムを約束し、天文学的な画像の独自の空間構造、時間構造、波長構造を活用することにより、古典的手法より優れた性能を発揮する。
本稿では,宇宙ベース,地上ベース,マルチ波長,時系列画像の4つの新しいデータセット(および1つのレガシデータセット)と16ビットの符号なし整数画像データを含む,天体物理学データに対するニューラル圧縮課題であるAstroCompressを紹介する。
我々は、データに容易にアクセスし、7つの損失のない圧縮方法(3つのニューラルと4つの非ニューラル、すべての実用的な最先端アルゴリズムを含む)をベンチマークするコードを提供します。
ロスレス圧縮実験の結果, ロスレス圧縮技術は観測所におけるデータ収集を向上し, 科学的応用におけるニューラル圧縮の導入に関するガイダンスを提供することができた。
本論文の範囲はロスレス圧縮に限定されるが,今後の研究におけるロスリー圧縮法の可能性についても論じる。
関連論文リスト
- GraphComp: Extreme Error-bounded Compression of Scientific Data via Temporal Graph Autoencoders [7.129137910302658]
科学データの誤り境界圧縮のためのグラフベース手法である GraphCOMP を提案する。
グラフニューラルネットワーク(GNN)に着想を得て,グラフのサイズを大幅に縮小する潜在表現を学習するための時間グラフオートエンコーダを提案する。
圧縮はプロセスを逆転させ、学習したグラフモデルと潜在表現を用いて元のデータの近似を再構築する。
論文 参考訳(メタデータ) (2025-05-08T18:58:54Z) - Sparse $L^1$-Autoencoders for Scientific Data Compression [0.0]
L1$-regularizedの高次元ラテント空間を用いたオートエンコーダの開発により,効率的なデータ圧縮手法を提案する。
本稿では,これらの情報に富む潜伏空間を用いて,ぼやけなどのアーティファクトを緩和し,科学的データに対する高効率なデータ圧縮手法を実現する方法について述べる。
論文 参考訳(メタデータ) (2024-05-23T07:48:00Z) - Convolutional variational autoencoders for secure lossy image compression in remote sensing [47.75904906342974]
本研究では,畳み込み変分オートエンコーダ(CVAE)に基づく画像圧縮について検討する。
CVAEは、JPEG2000のような従来の圧縮手法を圧縮ベンチマークデータセットのかなりのマージンで上回ることが示されている。
論文 参考訳(メタデータ) (2024-04-03T15:17:29Z) - Compression of Structured Data with Autoencoders: Provable Benefit of
Nonlinearities and Depth [83.15263499262824]
勾配勾配勾配は入力のスパース構造を完全に無視する解に収束することを示す。
浅層構造にデノナイジング関数を付加することにより,スパースデータの圧縮におけるガウス性能の改善方法を示す。
CIFAR-10 や MNIST などの画像データセットに対して,本研究の成果を検証した。
論文 参考訳(メタデータ) (2024-02-07T16:32:29Z) - Neural-based Compression Scheme for Solar Image Data [8.374518151411612]
我々は、NASAのデータ集約画像ミッションで使用されるニューラルネットワークに基づく損失圧縮手法を提案する。
本研究では,画像の局所構造と大域構造の両方を捉えるために,局所的および非局所的アテンションモジュールを備えた逆トレーニングニューラルネットワークを提案する。
このアルゴリズムをSDOデータ解析に使用するための概念実証として、圧縮画像を用いてコロナホール(CH)検出を行った。
論文 参考訳(メタデータ) (2023-11-06T04:13:58Z) - Hierarchical Autoencoder-based Lossy Compression for Large-scale High-resolution Scientific Data [12.831138965071945]
この研究は、大規模な科学的データを著しく圧縮するニューラルネットワークを提示するが、高い再構成品質も維持する。
提案モデルは,大規模高分解能気候モデルデータセットに適用可能な科学ベンチマークデータを用いて検証した。
本モデルでは,再構成品質を損なうことなく,複数のベンチマークデータセットに対して140の圧縮比を達成している。
論文 参考訳(メタデータ) (2023-07-09T16:11:02Z) - Scalable Hybrid Learning Techniques for Scientific Data Compression [6.803722400888276]
科学者は、抽出された興味の量(QoIs)を正確に保存する圧縮技術を必要とする
本稿では,データ圧縮のためのエンドツーエンドでスケーラブルなGPUベースのパイプラインとして実装された物理インフォームド圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-12-21T03:00:18Z) - Unrolled Compressed Blind-Deconvolution [77.88847247301682]
sparse multi channel blind deconvolution (S-MBD) はレーダー/ソナー/超音波イメージングなどの多くの工学的応用で頻繁に発生する。
そこで本研究では,受信した全信号に対して,はるかに少ない測定値からブラインドリカバリを可能にする圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-09-28T15:16:58Z) - COIN++: Data Agnostic Neural Compression [55.27113889737545]
COIN++は、幅広いデータモダリティをシームレスに扱うニューラルネットワーク圧縮フレームワークである。
様々なデータモダリティを圧縮することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-01-30T20:12:04Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。