論文の概要: Variable-Rate Deep Image Compression based on Low-Rank Adaptation by Progressive Learning
- arxiv url: http://arxiv.org/abs/2606.16107v1
- Date: Mon, 15 Jun 2026 01:46:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.030852
- Title: Variable-Rate Deep Image Compression based on Low-Rank Adaptation by Progressive Learning
- Title(参考訳): プログレッシブラーニングによる低ランク適応に基づく可変レート深層画像圧縮
- Authors: Xing-Yu Xu, Chen-Hsiu Huang, Ja-Ling Wu,
- Abstract要約: 本研究は,パラメータ効率のよい微調整法であるLo-Rank Adaptation (LoRA) に基づく可変レート画像圧縮の漸進的学習手法を提案する。
複数のモデルを利用する手法と比較すると,パラメータストレージの99%,データセットの90%,トレーニングステップの97%を節約できる。
- 参考スコア(独自算出の注目度): 2.586182381089325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the digital age, image compression is crucial for numerous applications, including web media, streaming services, high-resolution medical imaging, and connected vehicle networks, enabling efficient data storage and transmission. With the increasing demand for high-quality image communication, the need for advanced compression techniques becomes increasingly critical. Numerous Deep Image Compression (DIC) techniques have recently been introduced, showing impressive performance compared to traditional standards. However, variable-rate image compression remains an unresolved issue. Specific DIC methods deploy multiple networks to attain different compression rates, whereas others use a single model, which often results in higher computational complexity and reduced performance. This work proposes a progressive learning approach for variable-rate image compression based on the parameter-efficient fine-tuning method, the Low-Rank Adaptation (LoRA). We introduce an additional LoRA Rate-Adaptive Module (LoRAM) in DIC methods. Due to the re-parameterized merging of LoRA, our proposed method does not introduce additional computational complexity during inference. Compared to methods utilizing multiple models, comprehensive experiments demonstrate that our approach achieves competitive performance, saving 99\% in parameter storage, 90% in datasets, and 97% in training steps.
- Abstract(参考訳): デジタル時代において、画像圧縮は、Webメディア、ストリーミングサービス、高解像度の医療画像、コネクテッドカーネットワークなど多くのアプリケーションにとって不可欠であり、効率的なデータストレージと伝送を可能にしている。
高品質な画像通信の需要が高まるにつれ、高度な圧縮技術の必要性が高まっている。
多数のDeep Image Compression (DIC)技術が最近導入され、従来の標準に比べて優れたパフォーマンスを示している。
しかし、可変レート画像圧縮は未解決の問題のままである。
特定のDIC手法では、異なる圧縮速度を達成するために複数のネットワークをデプロイするが、他の方法では単一のモデルを使用するため、計算の複雑さが増し、性能が低下することが多い。
本研究は,パラメータ効率のよい微調整法であるLo-Rank Adaptation (LoRA) に基づく,可変レート画像圧縮のためのプログレッシブラーニング手法を提案する。
DIC法にLoRA Rate-Adaptive Module (LoRAM)を導入する。
LoRAの再パラメータ化により,提案手法では推論時に計算量が増大することはない。
複数のモデルを利用する手法と比較して、我々のアプローチは、パラメータストレージの99\%、データセットの90%、トレーニングステップの97%を節約し、競争性能を達成することを示した。
関連論文リスト
- Arbitrary Ratio Feature Compression via Next Token Prediction [52.10426317889982]
Arbitrary Ratio Feature Compression (ARFC)フレームワークは、任意の圧縮比を単一のモデルでサポートする。
ARCは、次の回帰予測によって圧縮を行う自動回帰モデルである。
MoSモジュールは複数の圧縮結果を利用して圧縮トークンを洗練する。
ERGCは、圧縮中の意味的および構造的関係を維持するために、トレーニングプロセスに統合される。
論文 参考訳(メタデータ) (2026-02-12T02:38:57Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - CALLIC: Content Adaptive Learning for Lossless Image Compression [64.47244912937204]
CALLICは、学習したロスレス画像圧縮のための新しい最先端(SOTA)を設定する。
本稿では,畳み込みゲーティング操作を利用したコンテンツ認識型自己回帰自己保持機構を提案する。
エンコーディング中、低ランク行列を用いて深度の畳み込みを含む事前学習層を分解し、レート誘導プログレッシブファインタニング(RPFT)による画像検査にインクリメンタルウェイトを適応させる。
推定エントロピーにより下位順にソートされたパッチを徐々に増加させたRPFTファインチューン,学習過程の最適化,適応時間の短縮を実現した。
論文 参考訳(メタデータ) (2024-12-23T10:41:18Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - High-Fidelity Variable-Rate Image Compression via Invertible Activation
Transformation [24.379052026260034]
Invertible Activation Transformation (IAT) モジュールを提案する。
IATとQLevelは、画像圧縮モデルに、画像の忠実さを良く保ちながら、細かな可変レート制御能力を与える。
提案手法は,特に複数再符号化後に,最先端の可変レート画像圧縮法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-09-12T07:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。