論文の概要: Adaptive Learned Image Compression with Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2603.25316v1
- Date: Thu, 26 Mar 2026 11:05:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.255303
- Title: Adaptive Learned Image Compression with Graph Neural Networks
- Title(参考訳): グラフニューラルネットワークを用いた適応学習画像圧縮
- Authors: Yunuo Chen, Bing He, Zezheng Lyu, Hongwei Hu, Qunshan Gu, Yuan Tian, Guo Lu,
- Abstract要約: 効率的な画像圧縮は局所的および大域的冗長性の両方のモデリングに依存する。
最先端の学習画像圧縮手法の多くはCNNやTransformerをベースとしている。
グラフニューラルネットワーク(GNN)に基づくコンテンツ適応型画像圧縮フレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.9245723594443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient image compression relies on modeling both local and global redundancy. Most state-of-the-art (SOTA) learned image compression (LIC) methods are based on CNNs or Transformers, which are inherently rigid. Standard CNN kernels and window-based attention mechanisms impose fixed receptive fields and static connectivity patterns, which potentially couple non-redundant pixels simply due to their proximity in Euclidean space. This rigidity limits the model's ability to adaptively capture spatially varying redundancy across the image, particularly at the global level. To overcome these limitations, we propose a content-adaptive image compression framework based on Graph Neural Networks (GNNs). Specifically, our approach constructs dual-scale graphs that enable flexible, data-driven receptive fields. Furthermore, we introduce adaptive connectivity by dynamically adjusting the number of neighbors for each node based on local content complexity. These innovations empower our Graph-based Learned Image Compression (GLIC) model to effectively model diverse redundancy patterns across images, leading to more efficient and adaptive compression. Experiments demonstrate that GLIC achieves state-of-the-art performance, achieving BD-rate reductions of 19.29%, 21.69%, and 18.71% relative to VTM-9.1 on Kodak, Tecnick, and CLIC, respectively. Code will be released at https://github.com/UnoC-727/GLIC.
- Abstract(参考訳): 効率的な画像圧縮は局所的および大域的冗長性の両方のモデリングに依存する。
ほとんどのSOTA(State-of-the-art)学習画像圧縮(lic)手法は、本質的に厳密なCNNやトランスフォーマーに基づいている。
標準のCNNカーネルとウィンドウベースのアテンション機構は、固定された受信フィールドと静的接続パターンを強制する。
この剛性は、特にグローバルレベルで、画像全体にわたって空間的に変化する冗長性を適応的にキャプチャするモデルの能力を制限している。
これらの制限を克服するために,グラフニューラルネットワーク(GNN)に基づくコンテント適応画像圧縮フレームワークを提案する。
具体的には、フレキシブルでデータ駆動の受容場を可能にするデュアルスケールグラフを構築する。
さらに,ローカルコンテンツの複雑さに基づいて,各ノードの隣接ノード数を動的に調整することで,適応接続を導入する。
これらのイノベーションにより、グラフベースのLearninged Image Compression(GLIC)モデルが、画像間の多様な冗長パターンを効果的にモデル化し、より効率的で適応的な圧縮を可能にします。
実験により、GLICは最先端のパフォーマンスを達成し、それぞれコダック、テクニック、CLICのVTM-9.1と比較して、BDレートの19.29%、21.69%、および18.71%の低下を達成した。
コードはhttps://github.com/UnoC-727/GLICでリリースされる。
関連論文リスト
- Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaptation [52.82508784748278]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
実験により,制御-GICは高い柔軟かつ制御可能な適応を可能にし,その結果が最近の最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-02T14:22:09Z) - Universal Deep Image Compression via Content-Adaptive Optimization with
Adapters [43.291753358414255]
ディープイメージ圧縮は、自然画像上のJPEGのような従来のコーデックよりも優れている。
深部画像圧縮は学習ベースであり、領域外画像に対して圧縮性能が著しく低下する問題に直面する。
本研究の目的は,自然画像や線画,漫画などの任意の領域に属する画像を圧縮することである。
論文 参考訳(メタデータ) (2022-11-02T07:01:30Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Joint Global and Local Hierarchical Priors for Learned Image Compression [30.44884350320053]
近年,従来の手書き画像コーデックと比較して,学習画像圧縮法の性能が向上している。
本稿では,ローカル情報とグローバル情報の両方をコンテンツに依存した方法で活用する,情報変換(Information Transformer, Informer)と呼ばれる新しいエントロピーモデルを提案する。
実験により,Informer はKodak および Tecnick データセットの最先端手法よりも速度歪み性能が向上することを示した。
論文 参考訳(メタデータ) (2021-12-08T06:17:37Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - OSLO: On-the-Sphere Learning for Omnidirectional images and its
application to 360-degree image compression [59.58879331876508]
全方向画像の表現モデルの学習について検討し、全方向画像の深層学習モデルで使用される数学的ツールを再定義するために、HEALPixの球面一様サンプリングの特性を利用することを提案する。
提案したオン・ザ・スフィア・ソリューションは、等方形画像に適用された類似の学習モデルと比較して、13.7%のビットレートを節約できる圧縮ゲインを向上させる。
論文 参考訳(メタデータ) (2021-07-19T22:14:30Z) - Learned Image Compression with Gaussian-Laplacian-Logistic Mixture Model
and Concatenated Residual Modules [22.818632387206257]
学習画像圧縮の2つの重要な要素は、潜在表現のエントロピーモデルと符号化/復号化ネットワークアーキテクチャである。
本稿では,よりフレキシブルなガウス・ラプラシア・ロジスティック混合モデル(GLLMM)を提案する。
符号化/復号化ネットワーク設計部では、複数の残差ブロックを追加のショートカット接続で直列接続する残差ブロック(CRB)を提案する。
論文 参考訳(メタデータ) (2021-07-14T02:54:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。