Fugu-MT 論文翻訳(概要): Video Compression for Spatiotemporal Earth System Data

論文の概要: Video Compression for Spatiotemporal Earth System Data

arxiv url: http://arxiv.org/abs/2506.19656v1
Date: Tue, 24 Jun 2025 14:20:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-25 19:48:23.67024
Title: Video Compression for Spatiotemporal Earth System Data
Title（参考訳）: 時空間地球系データに対するビデオ圧縮
Authors: Oscar J. Pellicer-Valero, Cesar Aybar, Gustau Camps Valls,
Abstract要約: 大規模な地球系データセットは、標準的なビデオと類似した特徴を示す。我々は、データセットによるマルチチャネル圧縮のためのライブラリであるxarray videoをビデオとして提示する。実世界の4つのマルチチャネルデータセットに対して,本ライブラリの有効性を示す。
参考スコア（独自算出の注目度）: 4.347703075408795
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large-scale Earth system datasets, from high-resolution remote sensing imagery to spatiotemporal climate model outputs, exhibit characteristics analogous to those of standard videos. Their inherent spatial, temporal, and spectral redundancies can thus be readily exploited by established video compression techniques. Here, we present xarrayvideo, a Python library for compressing multichannel spatiotemporal datasets by encoding them as videos. Our approach achieves compression ratios of up to 250x while maintaining high fidelity by leveraging standard, well-optimized video codecs through ffmpeg. We demonstrate the library's effectiveness on four real-world multichannel spatiotemporal datasets: DynamicEarthNet (very high resolution Planet images), DeepExtremeCubes (high resolution Sentinel-2 images), ERA5 (weather reanalysis data), and the SimpleS2 dataset (high resolution multichannel Sentinel-2 images), achieving Peak Signal-to-Noise Ratios (PSNRs) of 55.86, 40.60, 46.58, and 43.23 dB at 0.1 bits per pixel per band (bpppb) and 65.91, 54.28, 62.90, and 55.04 dB at 1 bpppb. We are redistributing two of these datasets, DeepExtremeCubes (2.3 Tb) and DynamicEarthNet (525 Gb), in the machine-learning-ready and cloud-ready TACO format through HuggingFace at significantly reduced sizes (270 Gb and 8.5 Gb, respectively) without compromising quality (PSNR 55.77-56.65 and 60.15). No performance loss is observed when the compressed versions of these datasets are used in their respective deep learning-based downstream tasks (next step reflectance prediction and landcover segmentation). In conclusion, xarrayvideo presents an efficient solution for handling the rapidly growing size of Earth observation datasets, making advanced compression techniques accessible and practical to the Earth science community. The library is available for use at https://github.com/IPL-UV/xarrayvideo
Abstract（参考訳）: 大規模な地球系データセット(高解像度リモートセンシング画像から時空間気象モデル出力)は、標準的なビデオと類似した特徴を示す。したがって、その固有の空間的、時間的、スペクトル的冗長性は、確立されたビデオ圧縮技術によって容易に利用することができる。ここでは、マルチチャネル時空間データセットをビデオとしてエンコードして圧縮するPythonライブラリであるxarray videoを紹介する。提案手法は,fmpegによる標準最適化ビデオコーデックを活用することにより,高忠実度を維持しつつ,最大250倍の圧縮比を実現する。 DynamicEarthNet (高解像度のPlanet画像), DeepExtremeCubes (高解像度のSentinel-2画像), ERA5 (高解像度のSentinel-2画像), SimpleS2データセット (高解像度のSentinel-2画像), Peak Signal-to-Noise Ratios (PSNRs) 55.86, 40.60, 46.58, 43.23 dB at 0.1 bits per band (bpppb) and 65.91, 54.28, 62.90, 55.04 dB at 1 bpppb。 DeepExtremeCubes (2.3 Tb) と DynamicEarthNet (525 Gb) という2つのデータセットを再配布しています。これらのデータセットの圧縮バージョンが、それぞれのディープラーニングベースの下流タスク(次のステップ反射率予測とランドカバーセグメンテーション)で使用される場合、パフォーマンス損失は観測されない。結論として、xarray videoは、急速に成長する地球観測データセットを扱うための効率的なソリューションを示し、高度な圧縮技術が地球科学コミュニティにとってアクセス可能で実用的なものにしている。このライブラリはhttps://github.com/IPL-UV/xarray videoで利用可能である。

関連論文リスト

Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression [61.500904231491596]
画像圧縮とビデオ圧縮のほとんどの手法は、画素空間における変換符号化を行い、冗長性を低減する。画像とビデオの圧縮, GLCイメージ, GLC-Video のための textbfGenerative textbfLatent textbfGLC (textbfGLC) モデルを提案する。
論文参考訳（メタデータ） (2025-05-22T03:31:33Z)
VidTwin: Video VAE with Decoupled Structure and Dynamics [24.51768013474122]
VidTwinはコンパクトなビデオオートエンコーダで、ビデオを2つの異なる遅延空間に分離する。構造潜時ベクトルは全体内容とグローバルな動きを捉え、ダイナミクス潜時ベクトルは微細な詳細と高速な動きを表す。実験により、VidTwinは高い圧縮率で高い復元品質で0.20%を達成することが示された。
論文参考訳（メタデータ） (2024-12-23T17:16:58Z)
Buffer Anytime: Zero-Shot Video Depth and Normal from Image Priors [54.8852848659663]
Buffer Anytimeは、ビデオから深さと正規マップ(幾何バッファと呼ばれる)を推定するためのフレームワークです。時間的整合性制約を持つ単一画像の先行値を活用することによって,高品質なビデオバッファ推定を実証する。
論文参考訳（メタデータ） (2024-11-26T09:28:32Z)
bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction [57.199618102578576]
疎二分量時間画像データから高画質の画像スタックを元の解像度で再構成する新しい方法であるbit2bitを提案する。 Poisson denoisingの最近の研究に触発されて、スパースバイナリ光子データから高密度な画像列を生成するアルゴリズムを開発した。本研究では,様々な課題の画像条件下でのSPADの高速映像を多種多種に含む新しいデータセットを提案する。
論文参考訳（メタデータ） (2024-10-30T17:30:35Z)
SPAC: Sampling-based Progressive Attribute Compression for Dense Point Clouds [51.313922535437726]
本研究では,高密度点雲のエンドツーエンド圧縮法を提案する。提案手法は,周波数サンプリングモジュール,適応スケール特徴抽出モジュール,幾何支援モジュール,大域的ハイパープライアエントロピーモデルを組み合わせた。
論文参考訳（メタデータ） (2024-09-16T13:59:43Z)
BVI-RLV: A Fully Registered Dataset and Benchmarks for Low-Light Video Enhancement [56.97766265018334]
本稿では,2つの異なる低照度条件下での様々な動きシナリオを持つ40のシーンからなる低照度映像データセットを提案する。我々は、プログラム可能なモータードリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供し、異なる光レベルにわたるピクセルワイドフレームアライメントのための画像ベースアプローチによりそれを洗練する。実験の結果,Low-light Video enhancement (LLVE) における完全登録ビデオペアの重要性が示された。
論文参考訳（メタデータ） (2024-07-03T22:41:49Z)
Neural-based Compression Scheme for Solar Image Data [8.374518151411612]
我々は、NASAのデータ集約画像ミッションで使用されるニューラルネットワークに基づく損失圧縮手法を提案する。本研究では,画像の局所構造と大域構造の両方を捉えるために,局所的および非局所的アテンションモジュールを備えた逆トレーニングニューラルネットワークを提案する。このアルゴリズムをSDOデータ解析に使用するための概念実証として、圧縮画像を用いてコロナホール(CH)検出を行った。
論文参考訳（メタデータ） (2023-11-06T04:13:58Z)
EfficientSCI: Densely Connected Network with Space-time Factorization for Large-scale Video Snapshot Compressive Imaging [6.8372546605486555]
圧縮率の高いUHDカラービデオは,PSNRが32dB以上である単一エンドツーエンドのディープラーニングモデルを用いて,スナップショット2次元計測から再構成可能であることを示す。提案手法は,従来のSOTAアルゴリズムよりも性能が優れ,リアルタイム性能が向上した。
論文参考訳（メタデータ） (2023-05-17T07:28:46Z)
Exploring Long- and Short-Range Temporal Information for Learned Video Compression [54.91301930491466]
圧縮性能を高めるために,映像コンテンツの特徴を活かし,時間的情報を探究することに注力する。本稿では,画像群(GOP)内で画像の推測中に連続的に更新できる時間前処理を提案する。この場合、時間的事前は、現在のGOP内のすべてのデコードされた画像の貴重な時間的情報を含む。本稿では,マルチスケール補償を実現する階層構造を設計する。
論文参考訳（メタデータ） (2022-08-07T15:57:18Z)
Fast-Vid2Vid: Spatial-Temporal Compression for Video-to-Video Synthesis [40.249030338644225]
映像合成 (Vid2Vid) は, セマンティックマップのシーケンスから写真リアルな映像を生成することで, 顕著な成果を上げている。 Fast-Vid2Vidは20 FPSのリアルタイムパフォーマンスを実現し、1つのV100 GPUで約8倍の計算コストを節約する。
論文参考訳（メタデータ） (2022-07-11T17:57:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。