論文の概要: Light-weight CNN-based VVC Inter Partitioning Acceleration
- arxiv url: http://arxiv.org/abs/2312.10567v1
- Date: Sun, 17 Dec 2023 00:20:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 15:55:49.145629
- Title: Light-weight CNN-based VVC Inter Partitioning Acceleration
- Title(参考訳): 軽量cnnベースvvcインターパーティショニング加速
- Authors: Yiqun Liu, Mohsen Abdoli, Thomas Guionnet, Christine Guillemot, Aline
Roumy
- Abstract要約: Versatile Video Coding(VVC)標準は、2020年にJVET(Joint Video Exploration Team)によって確定した。
VVC は Bjontegaard Delta-Rate (BD-rate) の約50%の圧縮効率向上を提供する。
本稿では,VVCにおけるパーティショニングを高速化するために,畳み込みニューラルネットワーク(CNN)に基づく手法を提案する。
- 参考スコア(独自算出の注目度): 28.62405283825515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Versatile Video Coding (VVC) standard has been finalized by Joint Video
Exploration Team (JVET) in 2020. Compared to the High Efficiency Video Coding
(HEVC) standard, VVC offers about 50% compression efficiency gain, in terms of
Bjontegaard Delta-Rate (BD-rate), at the cost of about 10x more encoder
complexity. In this paper, we propose a Convolutional Neural Network
(CNN)-based method to speed up inter partitioning in VVC. Our method operates
at the Coding Tree Unit (CTU) level, by splitting each CTU into a fixed grid of
8x8 blocks. Then each cell in this grid is associated with information about
the partitioning depth within that area. A lightweight network for predicting
this grid is employed during the rate-distortion optimization to limit the
Quaternary Tree (QT)-split search and avoid partitions that are unlikely to be
selected. Experiments show that the proposed method can achieve acceleration
ranging from 17% to 30% in the RandomAccess Group Of Picture 32 (RAGOP32) mode
of VVC Test Model (VTM)10 with a reasonable efficiency drop ranging from 0.37%
to 1.18% in terms of BD-rate increase.
- Abstract(参考訳): Versatile Video Coding(VVC)標準は、2020年にJVET(Joint Video Exploration Team)によって確定した。
高効率ビデオ符号化(HEVC)標準と比較して、VVCはBjontegaard Delta-Rate (BD-rate)の約50%の圧縮効率向上を提供し、エンコーダの複雑さは約10倍である。
本稿では,VVCにおけるインターパーティショニングを高速化する畳み込みニューラルネットワーク(CNN)を用いた手法を提案する。
本手法は,各CTUを8×8ブロックの固定格子に分割することにより,CTUレベルで動作する。
このグリッド内の各セルは、その領域内の分割深さに関する情報に関連付けられている。
このグリッドを予測するための軽量ネットワークは、第4次木分割探索(QT)を制限し、選択できないパーティションを避けるために、レート歪み最適化中に使用される。
実験により,vvcテストモデル(vtm)10における画像のランダムアクセス群(ragop32)の17%から30%までの加速が可能であり,bdレートの増加による効率低下は0.37%から1.18%であった。
関連論文リスト
- Channel-Aware Throughput Maximization for Cooperative Data Fusion in CAV [17.703608985129026]
接続型および自律型車両(CAV)は、認識範囲の拡大と知覚範囲の増大により、大きな注目を集めている。
盲点や障害物などの問題に対処するため、CAVは周囲の車両からのデータを集めるために車両間通信を採用している。
本稿では,適応データ圧縮のための自己教師付きオートエンコーダを活用した,CAVデータ融合を容易にするチャネル対応スループット手法を提案する。
論文 参考訳(メタデータ) (2024-10-06T00:43:46Z) - Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.91821712591901]
本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。
適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。
提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文 参考訳(メタデータ) (2024-03-18T11:48:20Z) - CNN-based Prediction of Partition Path for VVC Fast Inter Partitioning
Using Motion Fields [28.294065058301932]
Versatile Video Coding (VVC) 規格は先日,JVET (Joint Video Exploration Team) によって確定した。
VVCは圧縮効率が50%向上し、エンコーディングの複雑さが10倍に向上する。
本稿では,畳み込みニューラルネットワーク(CNN)を用いて,VVCにおける分割処理を高速化する手法を提案する。
論文 参考訳(メタデータ) (2023-10-20T22:26:49Z) - Leveraging progressive model and overfitting for efficient learned image
compression [14.937446839215868]
マルチスケールプログレッシブ(MSP)確率モデルと潜在表現オーバーフィッティング(LOF)技術を用いた強力で柔軟なlicフレームワークを提案する。
事前定義されたプロファイルの異なるフレームワークでは、圧縮効率と計算複雑性のバランスポイントを達成できる。
実験の結果,提案フレームワークはVVC/H.266標準よりも2.5%,1.0%,1.3%Bjontegaardデルタビットレート(BDレート)の低減を実現している。
論文 参考訳(メタデータ) (2022-10-08T21:54:58Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Efficient VVC Intra Prediction Based on Deep Feature Fusion and
Probability Estimation [57.66773945887832]
本稿では,フレーム内予測におけるVersatile Video Coding (VVC) の複雑性を,深層融合と確率推定の2段階のフレームワークを用いて最適化することを提案する。
特に高精細度(HD)および超高精細度(UHD)ビデオシーケンスにおいて,提案手法の優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-05-07T08:01:32Z) - Distortion-Aware Loop Filtering of Intra 360^o Video Coding with
Equirectangular Projection [81.63407194858854]
等角射影(ERP)フォーマットで投影された360$o$ビデオの符号化性能を向上させるため,歪みを考慮したループフィルタリングモデルを提案する。
提案モジュールは、符号化ユニット(CU)パーティションマスクに基づいてコンテンツ特性を分析し、部分的畳み込みによって処理し、指定された領域を活性化する。
論文 参考訳(メタデータ) (2022-02-20T12:00:18Z) - Keypoints-Based Deep Feature Fusion for Cooperative Vehicle Detection of
Autonomous Driving [2.6543018470131283]
本稿では,FPV-RCNNと呼ばれる,効率的なキーポイントに基づく深い特徴融合フレームワークを提案する。
鳥眼視(BEV)キーポイントの核融合と比較すると、FPV-RCNNは検出精度を約14%向上させる。
また,提案手法はCPMのサイズを0.3KB以下に削減し,従来のBEV機能マップの約50倍の小型化を実現した。
論文 参考訳(メタデータ) (2021-09-23T19:41:02Z) - CT-Net: Channel Tensorization Network for Video Classification [48.4482794950675]
3D畳み込みはビデオ分類には強力だが、しばしば計算コストがかかる。
ほとんどのアプローチは、畳み込み効率と機能的相互作用の十分性の間の好適なバランスを達成できない。
簡潔で斬新なチャネルネットワーク(CT-Net)を提案する。
我々のCT-Netは、精度および/または効率の点で、最近のSOTAアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-06-03T05:35:43Z) - DeepCompress: Efficient Point Cloud Geometry Compression [1.808877001896346]
本稿では,ポイントクラウド圧縮のためのより効率的なディープラーニングベースのエンコーダアーキテクチャを提案する。
CENIC(Efficient Neural Image Compression)から学習した活性化関数を組み込むことで,効率と性能が劇的に向上することを示す。
提案手法は,BjontegardデルタレートとPSNR値において,ベースラインアプローチよりも小さなマージンで優れていた。
論文 参考訳(メタデータ) (2021-06-02T23:18:11Z) - ELF-VC: Efficient Learned Flexible-Rate Video Coding [61.10102916737163]
低レイテンシモードの性能向上を実現するための,学習ビデオ圧縮のための新しいアイデアをいくつか提案する。
一般的なビデオテストセット UVG と MCL-JCV 上で,ELF-VC と呼ぶ手法をベンチマークする。
我々の手法は少なくとも5倍高速に動作し、これらの数値を報告するすべてのMLコーデックよりもパラメータが少ない。
論文 参考訳(メタデータ) (2021-04-29T17:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。