論文の概要: Easz: An Agile Transformer-based Image Compression Framework for Resource-constrained IoTs
- arxiv url: http://arxiv.org/abs/2505.01742v2
- Date: Wed, 14 May 2025 13:02:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 15:30:05.619621
- Title: Easz: An Agile Transformer-based Image Compression Framework for Resource-constrained IoTs
- Title(参考訳): Easz: リソース制約のあるIoTのためのアジャイルトランスフォーマーベースの画像圧縮フレームワーク
- Authors: Yu Mao, Jingzong Li, Jun Wang, Hong Xu, Tei-Wei Kuo, Nan Guan, Chun Jason Xue,
- Abstract要約: 我々はEaszと呼ばれる新しいトランスフォーマーベースのエッジコンピュートフリー画像符号化フレームワークを提案する。
Easzは計算オーバーヘッドをサーバにシフトするため、エッジ上の重いエンコーディングとモデル切り替えのオーバーヘッドを回避する。
受信機上での計算オーバーヘッドをさらに軽減するため、受信側での再構成負荷を低減するために、軽量なトランスフォーマーベースの再構成構造を導入する。
- 参考スコア(独自算出の注目度): 22.125830120893834
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Neural image compression, necessary in various machine-to-machine communication scenarios, suffers from its heavy encode-decode structures and inflexibility in switching between different compression levels. Consequently, it raises significant challenges in applying the neural image compression to edge devices that are developed for powerful servers with high computational and storage capacities. We take a step to solve the challenges by proposing a new transformer-based edge-compute-free image coding framework called Easz. Easz shifts the computational overhead to the server, and hence avoids the heavy encoding and model switching overhead on the edge. Easz utilizes a patch-erase algorithm to selectively remove image contents using a conditional uniform-based sampler. The erased pixels are reconstructed on the receiver side through a transformer-based framework. To further reduce the computational overhead on the receiver, we then introduce a lightweight transformer-based reconstruction structure to reduce the reconstruction load on the receiver side. Extensive evaluations conducted on a real-world testbed demonstrate multiple advantages of Easz over existing compression approaches, in terms of adaptability to different compression levels, computational efficiency, and image reconstruction quality.
- Abstract(参考訳): 様々な機械間通信シナリオで必要とされるニューラル画像圧縮は、その重いエンコード・デコード構造と、異なる圧縮レベル間の切り替えの柔軟性に悩まされている。
これにより、高い計算能力とストレージ能力を持つ強力なサーバ向けに開発されたエッジデバイスにニューラルネットワーク圧縮を適用する上で、大きな課題が生じる。
我々は、新しいトランスフォーマーベースのエッジコンピュートフリー画像符号化フレームワークであるEaszを提案し、この問題を解決するための一歩を踏み出した。
Easzは計算オーバーヘッドをサーバにシフトするため、エッジ上の重いエンコーディングとモデル切り替えのオーバーヘッドを回避する。
Easzは、パッチ解析アルゴリズムを用いて、条件付き一様サンプリング器を用いて画像内容を選択的に除去する。
消去された画素は、トランスベースのフレームワークを介して受信側で再構成される。
受信機上での計算オーバーヘッドをさらに軽減するため、受信側での再構成負荷を低減するために、軽量なトランスフォーマーベースの再構成構造を導入する。
実世界のテストベッド上で行った大規模な評価は、異なる圧縮レベルへの適応性、計算効率、画像再構成品質の観点から、既存の圧縮アプローチに対するEaszの複数の利点を示す。
関連論文リスト
- Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network [10.427300958330816]
リモートセンシング画像をデコードして、特に低解像度で高い知覚品質を実現することは、依然として大きな課題である。
Invertible Neural Network-based Remote Sensor Image compression (INN-RSIC)法を提案する。
我々の INN-RSIC は、認識品質の観点から、既存の最先端のディープラーニングベースの画像圧縮手法よりも優れています。
論文 参考訳(メタデータ) (2024-05-17T03:52:37Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Towards End-to-End Image Compression and Analysis with Transformers [99.50111380056043]
本稿では,クラウドベースの画像分類アプリケーションを対象として,トランスフォーマーを用いたエンドツーエンドの画像圧縮解析モデルを提案する。
我々は、圧縮された特徴から画像分類を行うためにビジョントランスフォーマー(ViT)モデルを再設計し、トランスフォーマーからの長期情報を用いて画像圧縮を容易にすることを目指している。
画像圧縮と分類作業の両方において,提案モデルの有効性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2021-12-17T03:28:14Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - CBANet: Towards Complexity and Bitrate Adaptive Deep Image Compression
using a Single Network [24.418215098116335]
CBANet(Complexity and Bitrate Adaptive Network)と呼ばれる新しいディープ画像圧縮フレームワークを提案する。
我々のCBANetは、動的計算複雑性制約の下での速度と歪みのトレードオフを考察している。
その結果、CBANetでは、計算複雑性の制約によって1つのシングルが複数のデコードをサポートできるようになった。
論文 参考訳(メタデータ) (2021-05-26T08:13:56Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。