論文の概要: Performance Analysis of DCT, Hadamard, and PCA in Block-Based Image Compression
- arxiv url: http://arxiv.org/abs/2601.06273v1
- Date: Fri, 09 Jan 2026 19:39:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.723098
- Title: Performance Analysis of DCT, Hadamard, and PCA in Block-Based Image Compression
- Title(参考訳): ブロック画像圧縮におけるDCT、アダマール、PCAの性能解析
- Authors: Yashika Ahlawat,
- Abstract要約: ブロックベースの画像圧縮は、信号エネルギーを少数の係数に集中させるために変換符号化に依存する。
古典コーデックは離散コサイン変換(DCT)のような固定変換を用いるが、主成分分析(PCA)のようなデータ駆動法はデコリレーションに理論的に最適である。
本稿では,DCT,Adamard,PCAを複数ブロックサイズおよび圧縮速度で比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Block based image compression relies on transform coding to concentrate signal energy into a small number of coefficients. While classical codecs use fixed transforms such as the Discrete Cosine Transform (DCT), data driven methods such as Principal Component Analysis (PCA) are theoretically optimal for decorrelation. This paper presents an experimental comparison of DCT, Hadamard, and PCA across multiple block sizes and compression rates. Using rate distortion and energy compaction analysis, we show that PCA outperforms fixed transforms only when block dimensionality is sufficiently large, while DCT remains near optimal for standard block sizes such as $8\times8$ and at low bit rates. These results explain the robustness of DCT in practical codecs and highlight the limitations of block wise learned transforms.
- Abstract(参考訳): ブロックベースの画像圧縮は、信号エネルギーを少数の係数に集中させるために変換符号化に依存する。
古典コーデックは離散コサイン変換(DCT)のような固定変換を用いるが、主成分分析(PCA)のようなデータ駆動法はデコリレーションに理論的に最適である。
本稿では,DCT,Adamard,PCAを複数ブロックサイズおよび圧縮速度で比較した。
速度歪みとエネルギー圧縮解析を用いて、PCAはブロック次元が十分に大きい場合にのみ定形変換を上回り、DCTは8\times8$や低ビットレートなどの標準ブロックサイズに対してほぼ最適であることを示す。
これらの結果は,実効コーデックにおけるDCTの堅牢性を説明し,ブロックワイズ変換の限界を強調する。
関連論文リスト
- Deeply-Conditioned Image Compression via Self-Generated Priors [75.29511865838812]
我々は,自己生成前駆体(DCIC-sgp)を経由したDeeply-Conditioned Image Compression(Deeply-Conditioned Image Compression)という,機能的分解を前提としたフレームワークを提案する。
我々のフレームワークは、Kodak、CLIC、Tecnickデータセット上のVVCテストモデルVTM-12.1に対して、14.4%、15.7%、および15.1%のBDレートの大幅な削減を実現している。
論文 参考訳(メタデータ) (2025-10-28T14:04:19Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression [67.34466255300339]
本稿では、SC画像圧縮における3つの重要な課題として、コンパクトな潜時特徴の学習、量子化ステップのサイズの適応、大規模なSCデータセットの欠如について述べる。
適応量子化モジュールを導入し、各周波数成分のスケールした均一ノイズを学習し、量子化の粒度を柔軟に制御する。
SDU-SCICD10Kは,基本SC画像,コンピュータレンダリング画像,およびPCおよびモバイルプラットフォームからのNSとSCの混合画像にまたがる1万以上の画像を含む,大規模なSC画像圧縮データセットを構築した。
論文 参考訳(メタデータ) (2025-02-21T03:15:16Z) - Extensions on low-complexity DCT approximations for larger blocklengths based on minimal angle similarity [0.0]
離散コサイン変換(DCT)は、KLT(Karhunen-Loeve transform)に関連があるため、画像とビデオの符号化の中心的なツールである。
16点, 32点, 64点のDCT近似を導入し, 精度の高いDCT行列列と近似変換によって誘導される行列との角度を最小化する。
高速アルゴリズムは低複雑さ変換のためにも開発され、性能と計算コストのバランスが良いと主張した。
論文 参考訳(メタデータ) (2024-10-20T01:20:35Z) - Fast Data-independent KLT Approximations Based on Integer Functions [0.0]
Karhunen-Loeve変換(KLT)は確立された離散変換であり、データのデコリレーションと次元減少の最適特性を示す。
本稿では、様々なラウンドオフ関数を用いて、低複雑さでデータに依存しないKLT近似のカテゴリを紹介する。
提案した変換は,古典的性能尺度を考慮した正確なKLTおよび近似と比較すると良好に動作する。
論文 参考訳(メタデータ) (2024-10-11T20:05:05Z) - JPEG Quantized Coefficient Recovery via DCT Domain Spatial-Frequential Transformer [45.134271969594614]
JPEG量子化係数回復のためのDCT領域空間周波数変換器(DCTransformer)を提案する。
提案するDCTransformerは,現在最先端のJPEGアーティファクト除去技術より優れている。
論文 参考訳(メタデータ) (2023-08-17T17:32:56Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Hybrid Model-based / Data-driven Graph Transform for Image Coding [54.31406300524195]
予測内残差ブロックを符号化するハイブリッドモデルベース/データ駆動方式を提案する。
変換行列の最初の$K$固有ベクトルは、安定性のための非対称離散正弦変換(ADST)のような統計モデルから導かれる。
WebPをベースライン画像として使用することにより、我々のハイブリッドグラフ変換は、デフォルトの離散コサイン変換(DCT)よりもエネルギーの圧縮が良く、KLTよりも安定性がよいことを示す。
論文 参考訳(メタデータ) (2022-03-02T15:36:44Z) - Low-complexity Rounded KLT Approximation for Image Compression [0.0]
Karhunen-Loeve変換(KLT)はデータデコリレーションや次元減少によく用いられる。
リアルタイムアプリケーションにおけるKLTの使用は、それを実装するための高速アルゴリズムを開発することの難しさによって厳しく制限されている。
本稿では,KLT行列の要素に対する円関数の適用により得られる,新しい低複雑性変換のクラスを提案する。
論文 参考訳(メタデータ) (2021-11-28T21:25:35Z) - A Multiparametric Class of Low-complexity Transforms for Image and Video
Coding [0.0]
本稿では,Bouguezel,Ahmed,Swamyの一連の論文に基づいて,低複素度8点DCT近似の新たなクラスを導入する。
最適DCT近似は、符号化効率と画像品質の指標の点で魅力的な結果を示すことを示す。
論文 参考訳(メタデータ) (2020-06-19T21:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。