Fugu-MT 論文翻訳(概要): GABIC: Graph-based Attention Block for Image Compression

論文の概要: GABIC: Graph-based Attention Block for Image Compression

arxiv url: http://arxiv.org/abs/2410.02981v1
Date: Thu, 3 Oct 2024 20:45:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-03 04:35:40.345805
Title: GABIC: Graph-based Attention Block for Image Compression
Title（参考訳）: GABIC:画像圧縮のためのグラフベースの注意ブロック
Authors: Gabriele Spadaro, Alberto Presta, Enzo Tartaglione, Jhony H. Giraldo, Marco Grangetto, Attilio Fiandrotti,
Abstract要約: 本研究は,k-Nearest Neighbors拡張アテンション機構に基づく特徴冗長性を低減するために,画像圧縮のためのグラフベースアテンションブロック(GABIC)を提案する。実験の結果,GABICは圧縮性能を向上し,特に高ビットレートで同等の手法より優れていた。
参考スコア（独自算出の注目度）: 14.04718553744466
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While standardized codecs like JPEG and HEVC-intra represent the industry standard in image compression, neural Learned Image Compression (LIC) codecs represent a promising alternative. In detail, integrating attention mechanisms from Vision Transformers into LIC models has shown improved compression efficiency. However, extra efficiency often comes at the cost of aggregating redundant features. This work proposes a Graph-based Attention Block for Image Compression (GABIC), a method to reduce feature redundancy based on a k-Nearest Neighbors enhanced attention mechanism. Our experiments show that GABIC outperforms comparable methods, particularly at high bit rates, enhancing compression performance.
Abstract（参考訳）: JPEGやHEVC-intraのような標準化されたコーデックは画像圧縮の業界標準であり、Neural Learned Image Compression (lic)コーデックは将来的な代替手段である。詳細は、Vision Transformerからlicモデルへのアテンション機構の統合により、圧縮効率が改善されている。しかし、余分な効率性は、しばしば冗長な機能を集約するコストを伴います。本研究は,k-Nearest Neighbors拡張アテンション機構に基づく特徴冗長性を低減する手法であるGABIC(Graph-based Attention Block for Image Compression)を提案する。実験の結果,GABICは圧縮性能を向上し,特に高ビットレートで同等の手法より優れていた。

関連論文リスト

Arbitrary Ratio Feature Compression via Next Token Prediction [52.10426317889982]
Arbitrary Ratio Feature Compression (ARFC)フレームワークは、任意の圧縮比を単一のモデルでサポートする。 ARCは、次の回帰予測によって圧縮を行う自動回帰モデルである。 MoSモジュールは複数の圧縮結果を利用して圧縮トークンを洗練する。 ERGCは、圧縮中の意味的および構造的関係を維持するために、トレーニングプロセスに統合される。
論文参考訳（メタデータ） (2026-02-12T02:38:57Z)
GIC-DLC: Differentiable Logic Circuits for Hardware-Friendly Grayscale Image Compression [25.639781877777665]
微分論理回路(GIC-DLC)を用いたグレースケール画像圧縮を提案する。我々は、ニューラルネットワークの柔軟性とブール演算の効率を組み合わせるために、ルックアップテーブルをトレーニングする。グレースケールのベンチマークデータセットの実験によると、GIC-DLCは圧縮効率において従来のコーデックよりも優れており、エネルギー消費と遅延の大幅な削減を可能にしている。これらの結果から,学習圧縮はハードウェアフレンドリであり,エッジデバイス上での低消費電力画像圧縮に有望な方向を提供することが示された。
論文参考訳（メタデータ） (2026-01-20T16:29:23Z)
Image Compression Using Singular Value Decomposition [0.0]
本研究では,画像圧縮における特異値分解と低ランク行列近似の利用について検討する。その結果、低ランク近似は、しばしばオリジナルと視覚的に類似した画像を生成することがわかった。低許容誤差レベルでは、Singular Value Decompositionによって生成された圧縮された表現は、元の画像のサイズを超えることができる。
論文参考訳（メタデータ） (2025-12-18T06:18:37Z)
Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文参考訳（メタデータ） (2025-03-27T13:01:53Z)
Bi-Level Spatial and Channel-aware Transformer for Learned Image Compression [0.0]
本稿では,特徴マップ内の周波数成分を考慮したトランスフォーマーに基づく画像圧縮手法を提案する。本手法は,空間ベース分岐が高周波数と低周波数を独立に扱うHSCATB(Hybrid Space-Channel Attention Transformer Block)を統合した。また、トランスフォーマーブロック内にMLGFFN(Mixed Local-Global Feed Forward Network)を導入し、多様な情報とリッチな情報の抽出を強化する。
論文参考訳（メタデータ） (2024-08-07T15:35:25Z)
Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution [33.69980388844034]
本稿では,一般的なJPEGアルゴリズムがさらなる圧縮に適していないことを示す。 Stain Quantized Latent Compression, a novel DL based histopathology data compression approach。提案手法はJPEGのような従来の手法と比較して,下流タスクの分類において優れた性能を示すことを示す。
論文参考訳（メタデータ） (2024-06-18T13:47:17Z)
UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文参考訳（メタデータ） (2024-05-27T05:52:13Z)
Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer [35.500720262253054]
本稿では,新しい画像生成圧縮(UIGC)パラダイムを導入し,生成と圧縮のプロセスを統合する。 UIGCフレームワークの重要な特徴は、トークン化にベクトル量子化(VQ)イメージモデルを採用することである。実験では、既存のコーデックよりも知覚品質と人間の知覚において、提案されたUIGCフレームワークが優れていることを示した。
論文参考訳（メタデータ） (2024-03-06T14:27:02Z)
Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文参考訳（メタデータ） (2024-01-06T03:03:28Z)
Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文参考訳（メタデータ） (2023-03-05T13:15:28Z)
Device Interoperability for Learned Image Compression with Weights and Activations Quantization [1.373801677008598]
本稿では,最先端の画像圧縮ネットワークのデバイス相互運用性問題を解決する手法を提案する。本稿では,クロスプラットフォームの符号化と復号化を保証し,高速に実装できる簡易な手法を提案する。
論文参考訳（メタデータ） (2022-12-02T17:45:29Z)
Cross Modal Compression: Towards Human-comprehensible Semantic Compression [73.89616626853913]
クロスモーダル圧縮は、視覚データのためのセマンティック圧縮フレームワークである。提案したCMCは,超高圧縮比で再現性の向上が期待できることを示す。
論文参考訳（メタデータ） (2022-09-06T15:31:11Z)
The Devil Is in the Details: Window-based Attention for Image Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文参考訳（メタデータ） (2022-03-16T07:55:49Z)
Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文参考訳（メタデータ） (2022-01-27T20:20:03Z)
A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。 EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文参考訳（メタデータ） (2020-02-09T14:21:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。