論文の概要: Attention-Based Neural Networks for Chroma Intra Prediction in Video
Coding
- arxiv url: http://arxiv.org/abs/2102.04993v1
- Date: Tue, 9 Feb 2021 18:01:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 15:07:00.503087
- Title: Attention-Based Neural Networks for Chroma Intra Prediction in Video
Coding
- Title(参考訳): 映像符号化におけるクロマ内予測のための注意型ニューラルネットワーク
- Authors: Marc G\'orriz, Saverio Blasi, Alan F. Smeaton, Noel E. O'Connor, Marta
Mrak
- Abstract要約: この研究は、クロマイントラプレディションのための注意に基づくアーキテクチャの複雑さを低減することに焦点を当てている。
推論過程の複雑さを低減するために,新しいサイズに依存しないマルチモデル手法を提案する。
本稿では,提案した予測アーキテクチャの複雑さのオーバーヘッドを軽減するため,単純化の集合について述べる。
- 参考スコア(独自算出の注目度): 13.638411611516172
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Neural networks can be successfully used to improve several modules of
advanced video coding schemes. In particular, compression of colour components
was shown to greatly benefit from usage of machine learning models, thanks to
the design of appropriate attention-based architectures that allow the
prediction to exploit specific samples in the reference region. However, such
architectures tend to be complex and computationally intense, and may be
difficult to deploy in a practical video coding pipeline. This work focuses on
reducing the complexity of such methodologies, to design a set of simplified
and cost-effective attention-based architectures for chroma intra-prediction. A
novel size-agnostic multi-model approach is proposed to reduce the complexity
of the inference process. The resulting simplified architecture is still
capable of outperforming state-of-the-art methods. Moreover, a collection of
simplifications is presented in this paper, to further reduce the complexity
overhead of the proposed prediction architecture. Thanks to these
simplifications, a reduction in the number of parameters of around 90% is
achieved with respect to the original attention-based methodologies.
Simplifications include a framework for reducing the overhead of the
convolutional operations, a simplified cross-component processing model
integrated into the original architecture, and a methodology to perform
integer-precision approximations with the aim to obtain fast and hardware-aware
implementations. The proposed schemes are integrated into the Versatile Video
Coding (VVC) prediction pipeline, retaining compression efficiency of
state-of-the-art chroma intra-prediction methods based on neural networks,
while offering different directions for significantly reducing coding
complexity.
- Abstract(参考訳): ニューラルネットワークは、高度なビデオ符号化スキームのいくつかのモジュールを改善するのにうまく使える。
特に、色成分の圧縮は、適切な注意に基づくアーキテクチャの設計により、参照領域で特定のサンプルを活用できるため、機械学習モデルの使用から大きな恩恵を受けることが示された。
しかし、そのようなアーキテクチャは複雑で計算的に激しい傾向があり、実用的なビデオコーディングパイプラインにデプロイすることは困難である。
本研究は,クロマイントラプレディションのための簡易かつ費用対効果の高いアテンションベースアーキテクチャを設計するために,そのような手法の複雑さを軽減することに焦点を当てる。
推論プロセスの複雑さを減らすために,新しいサイズ非依存のマルチモデルアプローチが提案されている。
結果として生じる単純化されたアーキテクチャは、最先端のメソッドを上回ることができる。
さらに,本論文では,提案した予測アーキテクチャの複雑さのオーバーヘッドを軽減するため,単純化の集合について述べる。
これらの簡略化のおかげで、元の注意ベースの方法論に関して、パラメータの約90%の減少が達成される。
単純化には、畳み込み操作のオーバーヘッドを減らすためのフレームワーク、元のアーキテクチャに統合された単純化されたクロスコンポーネント処理モデル、高速でハードウェア対応な実装を得るために整数精度近似を実行する方法論が含まれる。
提案手法はVersatile Video Coding(VVC)予測パイプラインに統合され,ニューラルネットワークに基づく最先端のクロマインプレディション手法の圧縮効率を維持しつつ,コーディングの複雑さを大幅に低減するための異なる方向を提供する。
関連論文リスト
- Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。
本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。
我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文 参考訳(メタデータ) (2024-03-26T16:33:12Z) - Neural Architecture Codesign for Fast Bragg Peak Analysis [1.7081438846690533]
我々は,高速かつリアルタイムなブラッグピーク解析のためのニューラルネットワーク符号の合理化のための自動パイプラインを開発した。
我々の手法では、ハードウェアコストを含むこれらのモデルを強化するために、ニューラルアーキテクチャ検索とAutoMLを使用し、よりハードウェア効率の良いニューラルアーキテクチャの発見に繋がる。
論文 参考訳(メタデータ) (2023-12-10T19:42:18Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent
Signals: Application to Hyperspectral Imaging [71.57324258813675]
相互依存信号のデータセットは、列が強い依存を示す行列として定義される。
ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。
ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文 参考訳(メタデータ) (2022-03-29T21:00:39Z) - SIRe-Networks: Skip Connections over Interlaced Multi-Task Learning and
Residual Connections for Structure Preserving Object Classification [28.02302915971059]
本稿では、オブジェクト分類タスクにおける消失勾配を低減するために、SIReを定義したインターレース型マルチタスク学習戦略を提案する。
提案手法は、自動エンコーダを介して入力画像構造を保存することにより、畳み込みニューラルネットワーク(CNN)を直接改善する。
提案手法を検証するため、SIRe戦略を介して単純なCNNと有名なネットワークの様々な実装を拡張し、CIFAR100データセットで広範囲にテストする。
論文 参考訳(メタデータ) (2021-10-06T13:54:49Z) - Improved CNN-based Learning of Interpolation Filters for Low-Complexity
Inter Prediction in Video Coding [5.46121027847413]
本稿では,ニューラルネットワークを用いた新しい予測手法を提案する。
新たなトレーニングフレームワークにより、各ネットワークブランチは特定の分数シフトに類似することができる。
Versatile Video Coding (VVC)テストモデルで実装されると、0.77%、1.27%、および2.25%のBDレートの節約が達成される。
論文 参考訳(メタデータ) (2021-06-16T16:48:01Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - MetaSDF: Meta-learning Signed Distance Functions [85.81290552559817]
ニューラルな暗示表現で形状を一般化することは、各関数空間上の学習先行値に比例する。
形状空間の学習をメタラーニング問題として定式化し、勾配に基づくメタラーニングアルゴリズムを利用してこの課題を解決する。
論文 参考訳(メタデータ) (2020-06-17T05:14:53Z) - Analytic Simplification of Neural Network based Intra-Prediction Modes
for Video Compression [10.08097582267397]
本稿では,学習モデルから簡易な予測法を導出する2つの方法を提案する。
これらの合理化技術は, 効率的な圧縮解に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T10:25:54Z) - HCM: Hardware-Aware Complexity Metric for Neural Network Architectures [6.556553154231475]
本稿では,ニューラルネットワークアーキテクチャのシステムデザイナを支援することを目的とした,ハードウェア対応の複雑性指標を提案する。
提案手法は,資源制限されたデバイス上でのニューラルネットワークモデルの設計代替案の評価にどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-04-19T16:42:51Z) - Structured Sparsification with Joint Optimization of Group Convolution
and Channel Shuffle [117.95823660228537]
本稿では,効率的なネットワーク圧縮のための新しい構造空間分割法を提案する。
提案手法は, 畳み込み重みに対する構造的疎度を自動的に誘導する。
また,学習可能なチャネルシャッフル機構によるグループ間通信の問題にも対処する。
論文 参考訳(メタデータ) (2020-02-19T12:03:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。