論文の概要: Partition Map-Based Fast Block Partitioning for VVC Inter Coding
- arxiv url: http://arxiv.org/abs/2504.18398v1
- Date: Fri, 25 Apr 2025 14:53:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.802992
- Title: Partition Map-Based Fast Block Partitioning for VVC Inter Coding
- Title(参考訳): VVCインターコーディングのための分割マップに基づく高速ブロック分割
- Authors: Xinmin Feng, Zhuoyuan Li, Li Li, Dong Liu, Feng Wu,
- Abstract要約: インターコーディングにおいて高速なブロック分割を追求する分割マップに基づくアルゴリズムを提案する。
分割マップを用いたイントラコーディング手法に関するこれまでの研究に基づいて,VVCインターコーディングの特性を解析した。
本稿では、複雑性の低減とRD性能損失の微妙なトレードオフを実現するための二重閾値決定方式を提案する。
- 参考スコア(独自算出の注目度): 37.60581844783291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Among the new techniques of Versatile Video Coding (VVC), the quadtree with nested multi-type tree (QT+MTT) block structure yields significant coding gains by providing more flexible block partitioning patterns. However, the recursive partition search in the VVC encoder increases the encoder complexity substantially. To address this issue, we propose a partition map-based algorithm to pursue fast block partitioning in inter coding. Based on our previous work on partition map-based methods for intra coding, we analyze the characteristics of VVC inter coding, and thus improve the partition map by incorporating an MTT mask for early termination. Next, we develop a neural network that uses both spatial and temporal features to predict the partition map. It consists of several special designs including stacked top-down and bottom-up processing, quantization parameter modulation layers, and partitioning-adaptive warping. Furthermore, we present a dual-threshold decision scheme to achieve a fine-grained trade-off between complexity reduction and rate-distortion (RD) performance loss. The experimental results demonstrate that the proposed method achieves an average 51.30% encoding time saving with a 2.12% Bjontegaard Delta Bit Rate (BDBR) under the random access configuration.
- Abstract(参考訳): Versatile Video Coding (VVC) の新たな技術の中で、ネストしたマルチタイプツリー(QT+MTT)ブロック構造を持つクワッドツリーは、より柔軟なブロック分割パターンを提供することで、大幅な符号化ゲインをもたらす。
しかし、VVCエンコーダにおける再帰的分割探索はエンコーダの複雑さを大幅に増大させる。
この問題に対処するため,我々はインターコーディングにおいて高速なブロック分割を追求するパーティションマップに基づくアルゴリズムを提案する。
イントラコーディングのためのパーティションマップベースの手法に関するこれまでの研究に基づいて、VVCインターコーディングの特性を分析し、早期終了のためのMTTマスクを組み込むことでパーティションマップを改善する。
次に,空間的特徴と時間的特徴を用いて分割マップを予測するニューラルネットワークを開発した。
スタック化されたトップダウンおよびボトムアップ処理、量子化パラメータ変調層、パーティショニング適応ワープなど、いくつかの特別な設計で構成されている。
さらに、複雑性低減とRD性能損失の微妙なトレードオフを実現するために、二重閾値決定方式を提案する。
実験結果から,BDBR(Bjontegaard Delta Bit Rate)の2.12%をランダムアクセス構成とし,平均51.30%の符号化時間節約を実現した。
関連論文リスト
- Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.91821712591901]
本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。
適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。
提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文 参考訳(メタデータ) (2024-03-18T11:48:20Z) - CNN-based Prediction of Partition Path for VVC Fast Inter Partitioning
Using Motion Fields [28.294065058301932]
Versatile Video Coding (VVC) 規格は先日,JVET (Joint Video Exploration Team) によって確定した。
VVCは圧縮効率が50%向上し、エンコーディングの複雑さが10倍に向上する。
本稿では,畳み込みニューラルネットワーク(CNN)を用いて,VVCにおける分割処理を高速化する手法を提案する。
論文 参考訳(メタデータ) (2023-10-20T22:26:49Z) - MMVC: Learned Multi-Mode Video Compression with Block-based Prediction
Mode Selection and Density-Adaptive Entropy Coding [21.147001610347832]
動作パターンに適応した特徴領域予測のための最適モードを選択するマルチモードビデオ圧縮フレームワークを提案する。
エントロピー符号化では、高密度かつスパースな後量子化残差ブロックを考慮し、任意のラン長符号化を適用して圧縮率を向上させる。
現状の映像圧縮方式や標準コーデックと比較すると,PSNRとMS-SSIMで測定したより優れた,あるいは競争的な結果が得られる。
論文 参考訳(メタデータ) (2023-04-05T07:37:48Z) - Efficient VVC Intra Prediction Based on Deep Feature Fusion and
Probability Estimation [57.66773945887832]
本稿では,フレーム内予測におけるVersatile Video Coding (VVC) の複雑性を,深層融合と確率推定の2段階のフレームワークを用いて最適化することを提案する。
特に高精細度(HD)および超高精細度(UHD)ビデオシーケンスにおいて,提案手法の優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-05-07T08:01:32Z) - Deep Learning-Based Intra Mode Derivation for Versatile Video Coding [65.96100964146062]
本稿では,Deep Learning based intra Mode Derivation (DLIMD) と呼ばれるインテリジェントイントラモード導出法を提案する。
DLIMDのアーキテクチャは、異なる量子化パラメータ設定と、非平方要素を含む可変符号化ブロックに適応するように開発されている。
提案手法は,Versatile Video Coding (VVC) テストモデルを用いて,Y, U, Vコンポーネントの平均ビットレートを2.28%, 1.74%, 2.18%削減できる。
論文 参考訳(メタデータ) (2022-04-08T13:23:59Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。