論文の概要: Analytic Simplification of Neural Network based Intra-Prediction Modes
for Video Compression
- arxiv url: http://arxiv.org/abs/2004.11056v1
- Date: Thu, 23 Apr 2020 10:25:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 12:45:11.161158
- Title: Analytic Simplification of Neural Network based Intra-Prediction Modes
for Video Compression
- Title(参考訳): ビデオ圧縮のためのニューラルネットワークに基づく予測モードの解析的単純化
- Authors: Maria Santamaria, Saverio Blasi, Ebroul Izquierdo, Marta Mrak
- Abstract要約: 本稿では,学習モデルから簡易な予測法を導出する2つの方法を提案する。
これらの合理化技術は, 効率的な圧縮解に繋がることを示す。
- 参考スコア(独自算出の注目度): 10.08097582267397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increasing demand for video content at higher resolutions, it is
evermore critical to find ways to limit the complexity of video encoding tasks
in order to reduce costs, power consumption and environmental impact of video
services. In the last few years, algorithms based on Neural Networks (NN) have
been shown to benefit many conventional video coding modules. But while such
techniques can considerably improve the compression efficiency, they usually
are very computationally intensive. It is highly beneficial to simplify models
learnt by NN so that meaningful insights can be exploited with the goal of
deriving less complex solutions. This paper presents two ways to derive
simplified intra-prediction from learnt models, and shows that these
streamlined techniques can lead to efficient compression solutions.
- Abstract(参考訳): 高い解像度でビデオコンテンツの需要が高まる中、コスト、電力消費、ビデオサービスの環境への影響を減らすために、ビデオエンコーディングタスクの複雑さを制限する方法を見つけることがより重要である。
過去数年間、ニューラルネットワーク(nn)に基づくアルゴリズムは、多くの従来のビデオコーディングモジュールに恩恵をもたらすことが示されている。
しかし、そのような技術は圧縮効率を大幅に向上させることができるが、通常は非常に計算集約的である。
NNが学んだモデルを単純化して、より複雑なソリューションを導き出すという目標に意味のある洞察を活用できることは、非常に有益である。
本稿では,学習モデルから簡易な予測法を導出する方法を2つ提案し,これらの合理化手法が効率的な圧縮解をもたらすことを示す。
関連論文リスト
- Hierarchical Patch Diffusion Models for High-Resolution Video Generation [50.42746357450949]
我々は,階層的な方法で,コンテキスト情報を低スケールから高スケールのパッチに伝播する深層文脈融合を開発する。
また,ネットワーク容量の増大と,粗い画像の細部への演算を行う適応計算を提案する。
得られたモデルは、クラス条件のビデオ生成において66.32の最先端FVDスコアと87.68のインセプションスコアを新たに設定する。
論文 参考訳(メタデータ) (2024-06-12T01:12:53Z) - Dynamic Semantic Compression for CNN Inference in Multi-access Edge
Computing: A Graph Reinforcement Learning-based Autoencoder [82.8833476520429]
部分オフロードにおける効果的な意味抽出と圧縮のための新しい意味圧縮手法であるオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
セマンティックエンコーダでは、CNNのチャネルアテンション機構に基づく特徴圧縮モジュールを導入し、最も情報性の高い特徴を選択して中間データを圧縮する。
セマンティックデコーダでは、受信した圧縮データから学習して中間データを再構築し、精度を向上させる軽量デコーダを設計する。
論文 参考訳(メタデータ) (2024-01-19T15:19:47Z) - Efficient Meta-Tuning for Content-aware Neural Video Delivery [40.3731358963689]
計算コストを削減するために,EMT(Efficient Meta-Tuning)を提案する。
EMTは入力ビデオの最初のチャンクにメタ学習モデルを適用する。
本稿では,ビデオフレームから最も困難なパッチを抽出するための新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-07-20T06:47:10Z) - Improved CNN-based Learning of Interpolation Filters for Low-Complexity
Inter Prediction in Video Coding [5.46121027847413]
本稿では,ニューラルネットワークを用いた新しい予測手法を提案する。
新たなトレーニングフレームワークにより、各ネットワークブランチは特定の分数シフトに類似することができる。
Versatile Video Coding (VVC)テストモデルで実装されると、0.77%、1.27%、および2.25%のBDレートの節約が達成される。
論文 参考訳(メタデータ) (2021-06-16T16:48:01Z) - Towards Transparent Application of Machine Learning in Video Processing [3.491870689686827]
ディープラーニングのブレークスルーにより、より効率的なビデオ圧縮とビデオ強化のための機械学習技術が開発されている。
新しいテクニックは、典型的には、リソースを消費するブラックボックス(内部の作業に関する透明性がほとんどない、過度に複雑である)の形で現れる。
本研究の目的は,ビデオ処理アプリケーションにおける学習モデルの理解と最適化である。
論文 参考訳(メタデータ) (2021-05-26T17:24:23Z) - Low-Fidelity End-to-End Video Encoder Pre-training for Temporal Action
Localization [96.73647162960842]
TALはビデオ理解の基本的な課題だが、難しい課題だ。
既存のtalメソッドは、アクション分類の監督を通じてビデオエンコーダを事前トレーニングする。
本稿では,ローファイダリティ・エンド・ツー・エンド(LoFi)ビデオエンコーダの事前学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-28T22:18:14Z) - Attention-Based Neural Networks for Chroma Intra Prediction in Video
Coding [13.638411611516172]
この研究は、クロマイントラプレディションのための注意に基づくアーキテクチャの複雑さを低減することに焦点を当てている。
推論過程の複雑さを低減するために,新しいサイズに依存しないマルチモデル手法を提案する。
本稿では,提案した予測アーキテクチャの複雑さのオーバーヘッドを軽減するため,単純化の集合について述べる。
論文 参考訳(メタデータ) (2021-02-09T18:01:22Z) - Interpreting CNN for Low Complexity Learned Sub-pixel Motion
Compensation in Video Coding [16.381904711953947]
分数精度補償運動に必要な参照サンプルの複雑さを改善する新しいニューラルネットワークベースのツールが提示される。
この手法がVersatile Video Coding (VVC) テストモデルで実装されると、個々のシーケンスに対する最大4.5%のBDレートの節約が達成される。
学習した複雑性は、完全なニューラルネットワークの適用と比較して大幅に減少する。
論文 参考訳(メタデータ) (2020-06-11T13:10:20Z) - Neural Network Compression Framework for fast model inference [59.65531492759006]
我々は、ニューラルネットワーク圧縮フレームワーク(NNCF)と呼ばれる、微調整によるニューラルネットワーク圧縮のための新しいフレームワークを提案する。
様々なネットワーク圧縮手法の最近の進歩を活用し、空間性、量子化、双項化などのいくつかの実装を行っている。
フレームワークは、トレーニングサンプル内に提供され、あるいは既存のトレーニングコードにシームレスに統合可能なスタンドアロンパッケージとして使用することができる。
論文 参考訳(メタデータ) (2020-02-20T11:24:01Z) - Structured Sparsification with Joint Optimization of Group Convolution
and Channel Shuffle [117.95823660228537]
本稿では,効率的なネットワーク圧縮のための新しい構造空間分割法を提案する。
提案手法は, 畳み込み重みに対する構造的疎度を自動的に誘導する。
また,学習可能なチャネルシャッフル機構によるグループ間通信の問題にも対処する。
論文 参考訳(メタデータ) (2020-02-19T12:03:10Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。