論文の概要: Estimation of Rate Control Parameters for Video Coding Using CNN
- arxiv url: http://arxiv.org/abs/2003.06315v1
- Date: Fri, 13 Mar 2020 14:18:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 01:21:30.325306
- Title: Estimation of Rate Control Parameters for Video Coding Using CNN
- Title(参考訳): CNNを用いたビデオ符号化における速度制御パラメータの推定
- Authors: Maria Santamaria, Ebroul Izquierdo, Saverio Blasi, Marta Mrak
- Abstract要約: レート制御方式でビット割り当てを行うことが可能な,フレーム内ビット数とフレーム内品質を正確に推定する手法を提案する。
このアルゴリズムはディープラーニングに基づいており、ネットワークは元のフレームを入力としてトレーニングされる。
局所的あるいは大域的な歪みを予測できる2つの手法が提案されている。
- 参考スコア(独自算出の注目度): 10.08097582267397
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rate-control is essential to ensure efficient video delivery. Typical
rate-control algorithms rely on bit allocation strategies, to appropriately
distribute bits among frames. As reference frames are essential for exploiting
temporal redundancies, intra frames are usually assigned a larger portion of
the available bits. In this paper, an accurate method to estimate number of
bits and quality of intra frames is proposed, which can be used for bit
allocation in a rate-control scheme. The algorithm is based on deep learning,
where networks are trained using the original frames as inputs, while
distortions and sizes of compressed frames after encoding are used as ground
truths. Two approaches are proposed where either local or global distortions
are predicted.
- Abstract(参考訳): レートコントロールは、効率的なビデオ配信を確保するために不可欠である。
典型的なレート制御アルゴリズムはビット割り当て戦略に依存し、フレーム間でビットを適切に分配する。
参照フレームは時間的冗長性を利用するのに不可欠であるため、イントラフレームは通常、利用可能なビットの大部分を割り当てられる。
本稿では,ビット数とフレーム内品質を正確に推定する手法を提案し,レート制御方式でビット割り当てを行う。
このアルゴリズムはディープラーニングに基づいており、元のフレームを入力としてネットワークを訓練し、エンコーディング後の圧縮フレームの歪みとサイズを基底真理として利用する。
局所的あるいは大域的な歪みを予測できる2つの手法が提案されている。
関連論文リスト
- High-Efficiency Neural Video Compression via Hierarchical Predictive Learning [27.41398149573729]
強化されたDeep Hierarchical Video Compression(DHVC 2.0)は、優れた圧縮性能と目覚ましい複雑さの効率を導入する。
階層的な予測符号化を使用して、各ビデオフレームをマルチスケール表現に変換する。
トランスミッションフレンドリーなプログレッシブデコーディングをサポートしており、パケットロスの存在下では特にネットワーク化されたビデオアプリケーションに有利である。
論文 参考訳(メタデータ) (2024-10-03T15:40:58Z) - Optimal Transcoding Resolution Prediction for Efficient Per-Title
Bitrate Ladder Estimation [9.332104035349932]
プリエンコーディングなしでコンテンツ最適化機能やはしごを効率的に決定できることを実証する。
Bjontegaard Delta rate loss of 1.21%。
論文 参考訳(メタデータ) (2024-01-09T08:01:47Z) - IBVC: Interpolation-driven B-frame Video Compression [68.18440522300536]
Bフレームビデオ圧縮は、双方向動作推定と動き補償(MEMC)符号化をミドルフレーム再構成に適用することを目的としている。
従来の学習アプローチでは、しばしば双方向の光フロー推定に依存するニューラルネットワークのPフレームコーデックをBフレームに直接拡張する。
これらの問題に対処するために,IBVC (Interpolation-B-frame Video Compression) という単純な構造を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:45:51Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - A Coding Framework and Benchmark towards Low-Bitrate Video Understanding [63.05385140193666]
我々は,従来のコーデックとニューラルネットワーク(NN)の両方を活用する,従来型ニューラル混合符号化フレームワークを提案する。
このフレームワークは、動画の移動効率の良いセマンティック表現を確実に保持することで最適化される。
8つのデータセットに3つのダウンストリームタスクを備えた低ビットレートビデオ理解ベンチマークを構築し、このアプローチの顕著な優位性を実証した。
論文 参考訳(メタデータ) (2022-02-06T16:29:15Z) - Neural Network based Inter bi-prediction Blending [8.815673539598816]
本稿では,ビデオ符号化におけるバイディディクションを改善するための学習的手法を提案する。
この文脈では、ブレンディング操作をさらに改善する単純なニューラルネットワークを導入する。
テストが行われ、ネットワークサイズが10k未満のネットワークサイズに対して、ランダムアクセス構成でBDレートが-1.4%改善された。
論文 参考訳(メタデータ) (2022-01-26T13:57:48Z) - BlockCopy: High-Resolution Video Processing with Block-Sparse Feature
Propagation and Online Policies [57.62315799929681]
BlockCopyは、事前訓練されたフレームベースのCNNを高速化して、より効率的にビデオを処理するスキームである。
軽量ポリシーネットワークは、画像内の重要領域を決定し、選択された領域のみに操作を適用する。
非選択領域の特徴は、単に前のフレームからコピーされ、計算数とレイテンシーが減少する。
論文 参考訳(メタデータ) (2021-08-20T21:16:01Z) - Frame-rate Up-conversion Detection Based on Convolutional Neural Network
for Learning Spatiotemporal Features [7.895528973776606]
本稿では、FRUCによる法医学的特徴をエンドツーエンドに学習するフレームレート変換検出ネットワーク(FCDNet)を提案する。
FCDNetは連続するフレームのスタックを入力として使用し、ネットワークブロックを使ってアーティファクトを効果的に学習して特徴を学習する。
論文 参考訳(メタデータ) (2021-03-25T08:47:46Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。