論文の概要: CNN-based Prediction of Partition Path for VVC Fast Inter Partitioning
Using Motion Fields
- arxiv url: http://arxiv.org/abs/2310.13838v1
- Date: Fri, 20 Oct 2023 22:26:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 04:58:50.256276
- Title: CNN-based Prediction of Partition Path for VVC Fast Inter Partitioning
Using Motion Fields
- Title(参考訳): 運動場を用いたVVC高速インターパーティショニングのCNNによる分割経路予測
- Authors: Yiqun Liu, Marc Riviere, Thomas Guionnet, Aline Roumy, Christine
Guillemot
- Abstract要約: Versatile Video Coding (VVC) 規格は先日,JVET (Joint Video Exploration Team) によって確定した。
VVCは圧縮効率が50%向上し、エンコーディングの複雑さが10倍に向上する。
本稿では,畳み込みニューラルネットワーク(CNN)を用いて,VVCにおける分割処理を高速化する手法を提案する。
- 参考スコア(独自算出の注目度): 28.294065058301932
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The Versatile Video Coding (VVC) standard has been recently finalized by the
Joint Video Exploration Team (JVET). Compared to the High Efficiency Video
Coding (HEVC) standard, VVC offers about 50% compression efficiency gain, in
terms of Bjontegaard Delta-Rate (BD-rate), at the cost of a 10-fold increase in
encoding complexity. In this paper, we propose a method based on Convolutional
Neural Network (CNN) to speed up the inter partitioning process in VVC.
Firstly, a novel representation for the quadtree with nested multi-type tree
(QTMT) partition is introduced, derived from the partition path. Secondly, we
develop a U-Net-based CNN taking a multi-scale motion vector field as input at
the Coding Tree Unit (CTU) level. The purpose of CNN inference is to predict
the optimal partition path during the Rate-Distortion Optimization (RDO)
process. To achieve this, we divide CTU into grids and predict the Quaternary
Tree (QT) depth and Multi-type Tree (MT) split decisions for each cell of the
grid. Thirdly, an efficient partition pruning algorithm is introduced to employ
the CNN predictions at each partitioning level to skip RDO evaluations of
unnecessary partition paths. Finally, an adaptive threshold selection scheme is
designed, making the trade-off between complexity and efficiency scalable.
Experiments show that the proposed method can achieve acceleration ranging from
16.5% to 60.2% under the RandomAccess Group Of Picture 32 (RAGOP32)
configuration with a reasonable efficiency drop ranging from 0.44% to 4.59% in
terms of BD-rate, which surpasses other state-of-the-art solutions.
Additionally, our method stands out as one of the lightest approaches in the
field, which ensures its applicability to other encoders.
- Abstract(参考訳): Versatile Video Coding (VVC) 規格は先日,JVET (Joint Video Exploration Team) によって確定した。
高効率ビデオ符号化(HEVC)標準と比較して、VVCはBjontegaard Delta-Rate(BDレート)の圧縮効率を約50%向上させ、符号化複雑性の10倍のコストで提供する。
本稿では,畳み込みニューラルネットワーク(CNN)を用いて,VVCにおける分割処理を高速化する手法を提案する。
まず、分割経路から派生したネストマルチタイプツリー(QTMT)パーティションを持つクワッドツリーの新しい表現を導入する。
次に、符号化木単位(ctu)レベルで入力として多スケール運動ベクトル場を有するu-netベースのcnnを開発した。
cnn推論の目的はrdo(rate-distortion optimization)プロセス中の最適分割経路を予測することである。
そこで我々は,CTUをグリッドに分割し,グリッドの各セルに対する第4次木深さとマルチタイプ木分割の決定を予測した。
第3に,各分割レベルでのcnn予測を用いて不要な分割パスのrdo評価をスキップする効率的なパーティショニングプルーニングアルゴリズムを提案する。
最後に、適応しきい値選択スキームを設計し、複雑さと効率のトレードオフをスケーラブルにする。
実験の結果,RandomAccess Group of Picture 32 (RAGOP32) では16.5%から60.2%の加速が可能であり,BD-rate では0.44%から4.59%の効率低下が認められた。
さらに,提案手法は,他のエンコーダへの適用性を保証するため,この分野で最も軽量な手法の一つとして注目される。
関連論文リスト
- Advanced Learning-Based Inter Prediction for Future Video Coding [46.4999280984859]
本稿では,従来の InterPF を代替する低複雑性学習型相互予測法を提案する。
LLIPは、効率的な推論のためにパラメータをエクスポートできる軽量ニューラルネットワークモデルを活用することにより、フィルタリングプロセスを強化する。
最終的には、InterPFの従来の手技フィルタリングパラメータを学習された最適フィルタリングパラメータに置き換える。
論文 参考訳(メタデータ) (2024-11-24T08:47:00Z) - Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.91821712591901]
本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。
適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。
提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文 参考訳(メタデータ) (2024-03-18T11:48:20Z) - Light-weight CNN-based VVC Inter Partitioning Acceleration [28.62405283825515]
Versatile Video Coding(VVC)標準は、2020年にJVET(Joint Video Exploration Team)によって確定した。
VVC は Bjontegaard Delta-Rate (BD-rate) の約50%の圧縮効率向上を提供する。
本稿では,VVCにおけるパーティショニングを高速化するために,畳み込みニューラルネットワーク(CNN)に基づく手法を提案する。
論文 参考訳(メタデータ) (2023-12-17T00:20:02Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Receptive Field-based Segmentation for Distributed CNN Inference
Acceleration in Collaborative Edge Computing [93.67044879636093]
協調エッジコンピューティングネットワークにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
我々は,CNNモデルを複数の畳み込み層に分割するために,融合層並列化を用いた新しい協調エッジコンピューティングを提案する。
論文 参考訳(メタデータ) (2022-07-22T18:38:11Z) - Efficient VVC Intra Prediction Based on Deep Feature Fusion and
Probability Estimation [57.66773945887832]
本稿では,フレーム内予測におけるVersatile Video Coding (VVC) の複雑性を,深層融合と確率推定の2段階のフレームワークを用いて最適化することを提案する。
特に高精細度(HD)および超高精細度(UHD)ビデオシーケンスにおいて,提案手法の優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-05-07T08:01:32Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - ACP: Automatic Channel Pruning via Clustering and Swarm Intelligence
Optimization for CNN [6.662639002101124]
近年、畳み込みニューラルネットワーク(CNN)はより深く広がっています。
既存のマグニチュードベースの切断方法は効率的ですが、圧縮ネットワークのパフォーマンスは予測不可能です。
新規な自動チャネル切断法(ACP)を提案する。
ACPは3つの異なる分類データセットに基づいていくつかの最先端CNNに対して評価される。
論文 参考訳(メタデータ) (2021-01-16T08:56:38Z) - I/O Lower Bounds for Auto-tuning of Convolutions in CNNs [2.571796445061562]
本研究では,複数のサブ計算からなる合成アルゴリズムの一般i/o下界理論を考案する。
我々は,データ再利用を十分に活用することにより,2つの主畳み込みアルゴリズムの近似i/o最適データフロー戦略を設計する。
実験結果から,自動チューニング方式によるデータフロー戦略は,cuDNNよりも平均約3.32倍の性能向上を達成できることがわかった。
論文 参考訳(メタデータ) (2020-12-31T15:46:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。