論文の概要: Low-Complexity Loeffler DCT Approximations for Image and Video Coding
- arxiv url: http://arxiv.org/abs/2207.14463v1
- Date: Fri, 29 Jul 2022 03:56:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-01 13:24:16.417907
- Title: Low-Complexity Loeffler DCT Approximations for Image and Video Coding
- Title(参考訳): 画像・映像符号化のための低複素loeffler dct近似
- Authors: D. F. G. Coelho, R. J. Cintra, F. M. Bayer, S. Kulasekera, A.
Madanayake, P. A. C. Martinez, T. L. T. Silveira, R. S. Oliveira, V. S.
Dimitrov
- Abstract要約: 本稿では,ローフラー離散コサイン変換(DCT)アルゴリズムに基づく行列パラメトリゼーション手法を提案する。
数個の8点DCT近似の数学的形式を統一する8点DCT近似の新しいクラスが提案された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduced a matrix parametrization method based on the Loeffler
discrete cosine transform (DCT) algorithm. As a result, a new class of
eight-point DCT approximations was proposed, capable of unifying the
mathematical formalism of several eight-point DCT approximations archived in
the literature. Pareto-efficient DCT approximations are obtained through
multicriteria optimization, where computational complexity, proximity, and
coding performance are considered. Efficient approximations and their scaled
16- and 32-point versions are embedded into image and video encoders, including
a JPEG-like codec and H.264/AVC and H.265/HEVC standards. Results are compared
to the unmodified standard codecs. Efficient approximations are mapped and
implemented on a Xilinx VLX240T FPGA and evaluated for area, speed, and power
consumption.
- Abstract(参考訳): 本稿では,loeffler discrete cosine transform (dct) アルゴリズムに基づく行列パラメトリゼーション法を提案する。
その結果,8点DCT近似の新しいクラスが提案され,文献にアーカイブされた数個の8点DCT近似の数学的定式化が可能となった。
パレート効率のDCT近似は、計算複雑性、近接性、符号化性能を考慮した多重基準最適化によって得られる。
効率的な近似と16点および32点のスケールバージョンは、JPEGライクなコーデックやH.264/AVC、H.265/HEVC標準を含む画像およびビデオエンコーダに埋め込まれている。
結果は修正されていない標準コーデックと比較される。
効率的な近似を Xilinx VLX240T FPGA 上にマッピングして実装し,面積,速度,消費電力を評価する。
関連論文リスト
- Extensions on low-complexity DCT approximations for larger blocklengths based on minimal angle similarity [0.0]
離散コサイン変換(DCT)は、KLT(Karhunen-Loeve transform)に関連があるため、画像とビデオの符号化の中心的なツールである。
16点, 32点, 64点のDCT近似を導入し, 精度の高いDCT行列列と近似変換によって誘導される行列との角度を最小化する。
高速アルゴリズムは低複雑さ変換のためにも開発され、性能と計算コストのバランスが良いと主張した。
論文 参考訳(メタデータ) (2024-10-20T01:20:35Z) - Fast Data-independent KLT Approximations Based on Integer Functions [0.0]
Karhunen-Loeve変換(KLT)は確立された離散変換であり、データのデコリレーションと次元減少の最適特性を示す。
本稿では、様々なラウンドオフ関数を用いて、低複雑さでデータに依存しないKLT近似のカテゴリを紹介する。
提案した変換は,古典的性能尺度を考慮した正確なKLTおよび近似と比較すると良好に動作する。
論文 参考訳(メタデータ) (2024-10-11T20:05:05Z) - Accelerating Error Correction Code Transformers [56.75773430667148]
本稿では,トランスを用いたデコーダの高速化手法を提案する。
最新のハードウェアでは、90%の圧縮比を実現し、算術演算エネルギー消費を少なくとも224倍削減する。
論文 参考訳(メタデータ) (2024-10-08T11:07:55Z) - Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers [56.37495946212932]
視覚変換器(ViT)は、畳み込みニューラルネットワーク(CNN)と比較して、コンピュータビジョンタスクにおいて優れた精度を示す。
ハードウェア指向の量子化対応アーキテクチャ検索フレームワークであるQuasar-ViTを提案する。
論文 参考訳(メタデータ) (2024-07-25T16:35:46Z) - Low-complexity Multidimensional DCT Approximations [0.0]
数個の乗算8時間8時間8$近似法が提案され、一般多次元の場合の計算複雑性が議論される。
提案手法は3次元DCTに基づくビデオ符号化方式に組み込まれ,量子化のステップが変更された。
シミュレーションの結果, 近似3次元DCT符号化法は, 正確な3次元DCT方式と比較すると, ほぼ同一の視覚的品質が得られることがわかった。
論文 参考訳(メタデータ) (2023-06-20T17:55:48Z) - Efficient Nearest Neighbor Search for Cross-Encoder Models using Matrix
Factorization [60.91600465922932]
本稿では,クロスエンコーダのみに頼って,二重エンコーダによる検索を回避する手法を提案する。
我々のアプローチは、現在の広く使われている方法よりも優れたテスト時間リコール-vs計算コストトレードオフを提供する。
論文 参考訳(メタデータ) (2022-10-23T00:32:04Z) - DCT Approximations Based on Chen's Factorization [0.17205106391379021]
2つの8点乗算自由DCT近似を提案し、その高速アルゴリズムも導出する。
JPEGライクな画像圧縮方式による実験を行い、競合する手法と比較した。
新しい変換セットをHEVCリファレンスソフトウェアに組み込み、HEVC準拠のビデオ符号化スキームを提供する。
論文 参考訳(メタデータ) (2022-07-24T02:31:28Z) - Neighbor Correspondence Matching for Flow-based Video Frame Synthesis [90.14161060260012]
フローベースフレーム合成のための近傍対応マッチング(NCM)アルゴリズムを提案する。
NCMは現在のフレームに依存しない方法で実行され、各ピクセルの時空間近傍でマルチスケールの対応を確立する。
粗いスケールのモジュールは、近隣の対応を利用して大きな動きを捉えるように設計されている。
論文 参考訳(メタデータ) (2022-07-14T09:17:00Z) - Deep Learning-Based Intra Mode Derivation for Versatile Video Coding [65.96100964146062]
本稿では,Deep Learning based intra Mode Derivation (DLIMD) と呼ばれるインテリジェントイントラモード導出法を提案する。
DLIMDのアーキテクチャは、異なる量子化パラメータ設定と、非平方要素を含む可変符号化ブロックに適応するように開発されている。
提案手法は,Versatile Video Coding (VVC) テストモデルを用いて,Y, U, Vコンポーネントの平均ビットレートを2.28%, 1.74%, 2.18%削減できる。
論文 参考訳(メタデータ) (2022-04-08T13:23:59Z) - A Multiparametric Class of Low-complexity Transforms for Image and Video
Coding [0.0]
本稿では,Bouguezel,Ahmed,Swamyの一連の論文に基づいて,低複素度8点DCT近似の新たなクラスを導入する。
最適DCT近似は、符号化効率と画像品質の指標の点で魅力的な結果を示すことを示す。
論文 参考訳(メタデータ) (2020-06-19T21:56:58Z) - On the Encoder-Decoder Incompatibility in Variational Text Modeling and
Beyond [82.18770740564642]
変分オートエンコーダ(VAE)は、潜時変数と償却変分推論を結合する。
我々は,データ多様体のパラメータ化が不十分なエンコーダ・デコーダの不整合性を観察する。
同一構造を持つ決定論的オートエンコーダとVAEモデルを結合した結合型VAEを提案する。
論文 参考訳(メタデータ) (2020-04-20T10:34:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。