論文の概要: TerraCodec: Compressing Earth Observations
- arxiv url: http://arxiv.org/abs/2510.12670v1
- Date: Tue, 14 Oct 2025 16:05:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.385968
- Title: TerraCodec: Compressing Earth Observations
- Title(参考訳): TerraCodec:地球観測を圧縮する
- Authors: Julen Costa-Watanabe, Isabelle Wittmann, Benedikt Blumenstiel, Konrad Schindler,
- Abstract要約: 地球観測衛星に適した学習コーデックであるTerraCodec(TEC)を紹介する。
TECには、マルチスペクトル入力に適応した効率的な画像ベースの変種と、テンポラルトランスフォーマーモデル(TEC-TT)が含まれている。
Latent Repackingは、様々なレート歪み設定で動作するフレキシブルレートトランスフォーマーモデルをトレーニングするための新しい方法である。
- 参考スコア(独自算出の注目度): 21.875360434422387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Earth observation (EO) satellites produce massive streams of multispectral image time series, posing pressing challenges for storage and transmission. Yet, learned EO compression remains fragmented, lacking publicly available pretrained models and misaligned with advances in compression for natural imagery. Image codecs overlook temporal redundancy, while video codecs rely on motion priors that fail to capture the radiometric evolution of largely static scenes. We introduce TerraCodec (TEC), a family of learned codecs tailored to EO. TEC includes efficient image-based variants adapted to multispectral inputs, as well as a Temporal Transformer model (TEC-TT) that leverages dependencies across time. To overcome the fixed-rate setting of today's neural codecs, we present Latent Repacking, a novel method for training flexible-rate transformer models that operate on varying rate-distortion settings. Trained on Sentinel-2 data, TerraCodec outperforms classical codecs, achieving 3-10x stronger compression at equivalent image quality. Beyond compression, TEC-TT enables zero-shot cloud inpainting, surpassing state-of-the-art methods on the AllClear benchmark. Our results establish bespoke, learned compression algorithms as a promising direction for Earth observation. Code and model weights will be released under a permissive license.
- Abstract(参考訳): 地球観測衛星(EO)は、多スペクトル画像時系列の膨大なストリームを生成し、保存と送信の困難を呈する。
しかし、学習されたEO圧縮は断片化され続けており、公開されている事前訓練されたモデルが欠如しており、自然画像の圧縮の進歩と一致していない。
画像コーデックは時間的冗長性を見落とし、ビデオコーデックは、主に静的なシーンのラジオメトリックの進化を捉えない動きの先行に頼っている。
本稿では,EOに合わせた学習コーデックであるTerraCodec(TEC)を紹介する。
TECには、マルチスペクトル入力に適応した効率的な画像ベースの変種と、時間にわたって依存関係を活用するテンポラルトランスフォーマーモデル(TEC-TT)が含まれている。
今日のニューラルコーデックの固定レート設定を克服するために、様々なレート歪み設定で動作するフレキシブルレートトランスフォーマーモデルをトレーニングする新しい方法であるLatent Repackingを提案する。
Sentinel-2データに基づいてトレーニングされたTerraCodecは、従来のコーデックよりも優れており、同等の画質で3,10倍強い圧縮を実現している。
TEC-TTは圧縮以外にも、AllClearベンチマークの最先端メソッドを越え、ゼロショットクラウドの塗装を可能にする。
この結果から,地球観測の有望な方向として圧縮アルゴリズムを学習した。
コードとモデルの重み付けはパーミッシブなライセンスでリリースされます。
関連論文リスト
- Generative Latent Video Compression [26.99743586846841]
本稿では,知覚的ビデオ圧縮の有効なフレームワークであるジェネレーティブ・ラテント・ビデオ圧縮(GLVC)を提案する。
GLVCは、ビデオフレームを知覚的に整列された潜在空間に投影するために、事前訓練された連続トークンを使用する。
GLVC は DISTS と LPIPS の指標で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-10-11T03:28:49Z) - Single-step Diffusion for Image Compression at Ultra-Low Bitrates [19.76457078979179]
超低速度で高い知覚品質と高速デコードを実現する画像圧縮のための単一ステップ拡散モデルを提案する。
このアプローチには2つの重要なイノベーションが含まれている。 (i) ベクトル量子残留(VQ-Residual)トレーニング。
圧縮性能は最先端の手法に匹敵し,デコード速度を約50倍向上させる。
論文 参考訳(メタデータ) (2025-06-19T19:53:27Z) - OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [39.746866725267516]
事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
実験により、OSCARは量的および視覚的品質の指標において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-05-22T00:14:12Z) - Rethinking Video Tokenization: A Conditioned Diffusion-based Approach [58.164354605550194]
新しいトークン化ツールであるDiffusion Conditioned-based Gene Tokenizerは、GANベースのデコーダを条件付き拡散モデルで置き換える。
再建に基本的MSE拡散損失とKL項,LPIPSを併用した訓練を行った。
CDTのスケールダウン版(3$times inference speedup)でさえ、トップベースラインと互換性がある。
論文 参考訳(メタデータ) (2025-03-05T17:59:19Z) - U-TILISE: A Sequence-to-sequence Model for Cloud Removal in Optical
Satellite Time Series [22.39321609253005]
我々は,クラウドにマッピングされた入力シーケンスを,クラウドのない出力シーケンスにマッピングできるニューラルモデルを開発した。
本研究では,欧州全域で取得した衛星センチネル2時系列のデータセットを用いて,提案モデルの有効性を実験的に評価した。
標準ベースラインと比較して、PSNRは以前見られた場所で1.8dB、見えない場所では1.3dB増加する。
論文 参考訳(メタデータ) (2023-05-22T17:37:10Z) - Exploring Long- and Short-Range Temporal Information for Learned Video
Compression [54.91301930491466]
圧縮性能を高めるために,映像コンテンツの特徴を活かし,時間的情報を探究することに注力する。
本稿では,画像群(GOP)内で画像の推測中に連続的に更新できる時間前処理を提案する。
この場合、時間的事前は、現在のGOP内のすべてのデコードされた画像の貴重な時間的情報を含む。
本稿では,マルチスケール補償を実現する階層構造を設計する。
論文 参考訳(メタデータ) (2022-08-07T15:57:18Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。