論文の概要: A PPO-Based Bitrate Allocation Conditional Diffusion Model for Remote Sensing Image Compression
- arxiv url: http://arxiv.org/abs/2603.15365v1
- Date: Mon, 16 Mar 2026 14:40:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 18:28:58.495165
- Title: A PPO-Based Bitrate Allocation Conditional Diffusion Model for Remote Sensing Image Compression
- Title(参考訳): リモートセンシング画像圧縮のためのPPOに基づくビットレート配置条件拡散モデル
- Authors: Yuming Han, Jooho Kim, Anish Shakya,
- Abstract要約: 高解像度のドローン画像は、都市の監視と災害評価に貴重な構造の詳細を提供する。
大規模なデータセットは数百ギガバイトに容易に到達でき、ストレージと長期管理に大きな課題が生じる。
強い性能を維持しつつ高い圧縮率を達成するためのPPOベースの条件拡散割当フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.5046831208137846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing remote sensing image compression methods still explore to balance high compression efficiency with the preservation of fine details and task-relevant information. Meanwhile, high-resolution drone imagery offers valuable structural details for urban monitoring and disaster assessment, but large-area datasets can easily reach hundreds of gigabytes, creating significant challenges for storage and long-term management. In this paper, we propose a PPO-based bitrate allocation Conditional Diffusion Compression (PCDC) framework. PCDC integrates a conditional diffusion decoder with a PPO-based block-wise bitrate allocation strategy to achieve high compression ratios while maintaining strong perceptual performance. We also release a high-resolution drone image dataset with richer structural details at a consistent low altitude over residential neighborhoods in coastal urban areas. Experimental results show compression ratios of 19.3x on DIV2K and 21.2x on the drone image dataset. Moreover, downstream object detection experiments demonstrate that the reconstructed images preserve task-relevant information with negligible performance loss.
- Abstract(参考訳): 既存のリモートセンシング画像圧縮手法は、細部やタスク関連情報の保存と高い圧縮効率のバランスを保とうとしている。
一方、高解像度のドローン画像は、都市の監視と災害評価に貴重な構造的詳細を提供するが、大規模なデータセットは数百ギガバイトに容易に到達でき、ストレージと長期管理に重大な課題をもたらす。
本稿では,PPOに基づくビットレート割り当て条件拡散圧縮(PCDC)フレームワークを提案する。
PCDCは、条件拡散デコーダとPPOベースのブロックワイドビットレート割り当て戦略を統合し、強い知覚性能を維持しながら高い圧縮比を達成する。
また、沿岸都市部の住宅地に対して一貫した低高度で、より詳細な構造を持つ高解像度ドローン画像データセットもリリースしました。
実験の結果、DIV2Kでは19.3倍、ドローン画像データセットでは21.2倍の圧縮比が示された。
さらに、下流オブジェクト検出実験により、再構成された画像はタスク関連情報を無視可能な性能損失で保存することを示した。
関連論文リスト
- Learned Image Compression for Earth Observation: Implications for Downstream Segmentation Tasks [2.048356018298881]
データ量を削減するためのタスク固有学習圧縮アルゴリズムの可能性を評価する。
圧縮学習はJPEG 2000よりも大規模で多チャンネルの光学画像に優れる。
従来のコーデックは、より小さな単一チャネルの熱赤外データセットで競争力を維持している。
論文 参考訳(メタデータ) (2025-12-01T15:27:33Z) - Deeply-Conditioned Image Compression via Self-Generated Priors [75.29511865838812]
我々は,自己生成前駆体(DCIC-sgp)を経由したDeeply-Conditioned Image Compression(Deeply-Conditioned Image Compression)という,機能的分解を前提としたフレームワークを提案する。
我々のフレームワークは、Kodak、CLIC、Tecnickデータセット上のVVCテストモデルVTM-12.1に対して、14.4%、15.7%、および15.1%のBDレートの大幅な削減を実現している。
論文 参考訳(メタデータ) (2025-10-28T14:04:19Z) - SANR: Scene-Aware Neural Representation for Light Field Image Compression with Rate-Distortion Optimization [54.184486302645716]
エンドツーエンドの速度歪みを最適化した光場画像圧縮のためのScene-Aware Neural Representationフレームワークを提案する。
シーン認識のために,SANRは階層的なシーンモデリングブロックを導入している。
実験の結果,SANRはHEVCに対する65.62%のBD節減率で,変形率に関する最先端技術よりも有意に優れていた。
論文 参考訳(メタデータ) (2025-10-17T16:00:43Z) - FIPER: Factorized Features for Robust Image Super-Resolution and Compression [17.542586429972765]
低レベル視覚タスクに統一表現(Factized Features)を用いることを提案する。
これらのタスク間の共通原則によって動機付けられ、細かい画像の詳細を復元し保存する必要がある。
論文 参考訳(メタデータ) (2024-10-23T17:59:57Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaptation [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
実験により,制御-GICは高い柔軟かつ制御可能な適応を可能にし,その結果が最近の最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Convolutional variational autoencoders for secure lossy image compression in remote sensing [47.75904906342974]
本研究では,畳み込み変分オートエンコーダ(CVAE)に基づく画像圧縮について検討する。
CVAEは、JPEG2000のような従来の圧縮手法を圧縮ベンチマークデータセットのかなりのマージンで上回ることが示されている。
論文 参考訳(メタデータ) (2024-04-03T15:17:29Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。