論文の概要: Parallelized Rate-Distortion Optimized Quantization Using Deep Learning
- arxiv url: http://arxiv.org/abs/2012.06380v1
- Date: Fri, 11 Dec 2020 14:28:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 03:09:41.876957
- Title: Parallelized Rate-Distortion Optimized Quantization Using Deep Learning
- Title(参考訳): ディープラーニングを用いた並列化速度歪み最適化量子化
- Authors: Dana Kianfar, Auke Wiggers, Amir Said, Reza Pourreza, Taco Cohen
- Abstract要約: RDOQはH.264/AVC、H.265/HEVC、VP9、AV1といった最近のビデオ圧縮標準の符号化性能において重要な役割を果たしている。
この研究は、オフラインの教師付きトレーニング中にトレードオフレートと歪みを学習するニューラルネットワークベースのアプローチを用いて、この制限に対処する。
- 参考スコア(独自算出の注目度): 9.886383889250064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rate-Distortion Optimized Quantization (RDOQ) has played an important role in
the coding performance of recent video compression standards such as H.264/AVC,
H.265/HEVC, VP9 and AV1. This scheme yields significant reductions in bit-rate
at the expense of relatively small increases in distortion. Typically, RDOQ
algorithms are prohibitively expensive to implement on real-time hardware
encoders due to their sequential nature and their need to frequently obtain
entropy coding costs. This work addresses this limitation using a neural
network-based approach, which learns to trade-off rate and distortion during
offline supervised training. As these networks are based solely on standard
arithmetic operations that can be executed on existing neural network hardware,
no additional area-on-chip needs to be reserved for dedicated RDOQ circuitry.
We train two classes of neural networks, a fully-convolutional network and an
auto-regressive network, and evaluate each as a post-quantization step designed
to refine cheap quantization schemes such as scalar quantization (SQ). Both
network architectures are designed to have a low computational overhead. After
training they are integrated into the HM 16.20 implementation of HEVC, and
their video coding performance is evaluated on a subset of the H.266/VVC SDR
common test sequences. Comparisons are made to RDOQ and SQ implementations in
HM 16.20. Our method achieves 1.64% BD-rate savings on luminosity compared to
the HM SQ anchor, and on average reaches 45% of the performance of the
iterative HM RDOQ algorithm.
- Abstract(参考訳): RDOQはH.264/AVC、H.265/HEVC、VP9、AV1といった最近のビデオ圧縮標準の符号化性能において重要な役割を果たしている。
このスキームは比較的小さな歪みの増加を犠牲にしてビットレートを著しく低下させる。
通常、rdoqアルゴリズムは、逐次的な性質とエントロピー符号化コストを頻繁に得る必要性から、リアルタイムなハードウェアエンコーダを実装するのに非常に高価である。
この研究は、オフラインの教師付きトレーニング中にトレードオフレートと歪みを学習するニューラルネットワークベースのアプローチを用いて、この制限に対処する。
これらのネットワークは、既存のニューラルネットワークハードウェア上で実行可能な標準的な演算のみに基づいているため、専用のRDOQ回路のために追加の領域オンチップを予約する必要はない。
我々は,完全畳み込みネットワークと自己回帰ネットワークの2種類のニューラルネットワークを訓練し,スカラー量子化(sq)などの安価量子化スキームを洗練するために設計されたポスト量子化ステップとして評価する。
両方のネットワークアーキテクチャは計算オーバーヘッドが低いように設計されている。
訓練後、HEVCのHM 16.20実装に統合され、ビデオ符号化性能はH.266/VVC共通テストシーケンスのサブセットで評価される。
RDOQとSQをHM 16.20で比較する。
提案手法は,HM SQアンカーに比べて光度に1.64%のBDレートの節約を実現し,HM RDOQアルゴリズムの性能の45%に達する。
関連論文リスト
- TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Channelformer: Attention based Neural Solution for Wireless Channel
Estimation and Effective Online Training [1.0499453838486013]
本稿では,改良されたチャネル推定を実現するために,エンコーダ・デコーダニューラルアーキテクチャ(Channelformer)を提案する。
我々は,復号器として,エンコーダと残差畳み込みニューラルアーキテクチャに多面的注意を払っている。
また,現代通信システムにおける第5世代(5G)新しい無線(NR)構成に基づく効果的なオンライントレーニング手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T23:18:23Z) - CADyQ: Content-Aware Dynamic Quantization for Image Super-Resolution [55.50793823060282]
本稿では,画像超解像(SR)ネットワークのための新しいコンテント・アウェア・ダイナミック量子化(CADyQ)手法を提案する。
CADyQは、入力画像のローカル内容に基づいて、局所領域と層に最適なビットを適応的に割り当てる。
パイプラインは様々なSRネットワークでテストされ、いくつかの標準ベンチマークで評価されている。
論文 参考訳(メタデータ) (2022-07-21T07:50:50Z) - Video Coding for Machines with Feature-Based Rate-Distortion
Optimization [7.804710977378487]
ニューラルネットワークの安定した改善により、ますます多くのマルチメディアデータが人間によって観測されなくなる。
本稿では,コーディング性能の向上を目的とした標準準拠機能ベースのRDO(FRDO)を提案する。
提案したFRDOとHFRDOのハイブリッドバージョンを比較し,特徴空間の歪みを従来のRDOと比較した。
論文 参考訳(メタデータ) (2022-03-11T12:49:50Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - ALF: Autoencoder-based Low-rank Filter-sharing for Efficient
Convolutional Neural Networks [63.91384986073851]
オートエンコーダを用いた低ランクフィルタ共有技術(ALF)を提案する。
ALFは、ネットワークパラメータの70%、オペレーションの61%、実行時間の41%を削減し、精度の低下を最小限にしている。
論文 参考訳(メタデータ) (2020-07-27T09:01:22Z) - Efficient Integer-Arithmetic-Only Convolutional Neural Networks [87.01739569518513]
我々は従来のReLUを境界ReLUに置き換え、その減少は活性化量子化によるものであることを示す。
我々の整数ネットワークは、対応するFPNネットワークと同等の性能を発揮するが、メモリコストは1/4に過ぎず、最新のGPUでは2倍高速である。
論文 参考訳(メタデータ) (2020-06-21T08:23:03Z) - Deep HyperNetwork-Based MIMO Detection [10.433286163090179]
従来のアルゴリズムは複雑すぎて実用的すぎるか、パフォーマンスが悪いかのどちらかだ。
最近のアプローチでは、ディープニューラルネットワークとして検出器を実装することで、これらの課題に対処しようとした。
本研究では、チャネル行列を入力とし、ニューラルネットワークベースの検出器の重みを生成するハイパーネットワークと呼ばれる追加のニューラルネットワーク(NN)をトレーニングすることで、両方の問題に対処する。
論文 参考訳(メタデータ) (2020-02-07T13:03:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。