論文の概要: Spatio-Temporal Correlation Guided Geometric Partitioning for Versatile Video Coding
- arxiv url: http://arxiv.org/abs/2606.01701v1
- Date: Mon, 01 Jun 2026 05:11:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.383094
- Title: Spatio-Temporal Correlation Guided Geometric Partitioning for Versatile Video Coding
- Title(参考訳): 垂直ビデオ符号化における時空間相関ガイドによる幾何学的分割
- Authors: Xuewei Meng, Chuanmin Jia, Xinfeng Zhang, Shanshe Wang, Siwei Ma,
- Abstract要約: 映像符号化の運動場における物体情報信号を記述するためのガイド付き幾何分割法(STGEO)を提案する。
提案手法は,分割モードや移動情報を含む側情報に対して消費されるビットをエコノマイズすることができる。
主なアイデアは、選択可能性の高いSTGEOモードと運動候補を予測することである。
- 参考スコア(独自算出の注目度): 55.405068056883614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric partitioning has attracted increasing attention by its remarkable motion field description capability in the hybrid video coding framework. However, the existing geometric partitioning (GEO) scheme in Versatile Video Coding (VVC) causes a non-negligible burden for signaling the side information. Consequently, the coding efficiency is limited. In view of this, we propose a spatio-temporal correlation guided geometric partitioning (STGEO) scheme to efficiently describe the object information in the motion field of video coding. The proposed method can economize the bits consumed for side information signaling, including the partitioning mode and motion information. We firstly analyze the characteristics of partitioning mode decision and motion vector selection in a statistically-sound way. Based on the observed spatio-temporal correlation, we design a mode prediction and coding method to reduce the overhead for representing the above mentioned side information. The main idea is to predict the STGEO modes and motion candidates that have higher selection possibilities, which can guide the entropy coding, i.e., representing the predicted high-probability modes and motion candidates with fewer bits. In particular, the high-probability STGEO modes are predicted based on the edge information and history modes of adjacent STGEO-coded blocks. The corresponding motion information is represented by the index in a merge candidate list, which is adaptively inferred based on the off-line trained merge candidate selection probability. Simulation results show that the proposed approach achieves 0.95% and 1.98% bit-rate savings on average compared to VTM-8.0 without GEO for Random Access and Low-Delay B configurations, respectively.
- Abstract(参考訳): ハイブリッドビデオ符号化フレームワークにおける運動場記述機能により,幾何学的分割が注目されている。
しかし、Versatile Video Coding (VVC) における既存の幾何分割(GEO)方式は、側情報を信号する上で、無視できない負担を生じさせる。
これにより、符号化効率が制限される。
そこで本研究では,映像符号化の運動場におけるオブジェクト情報を効率的に記述するための時空間相関型幾何分割法(STGEO)を提案する。
提案手法は,分割モードや移動情報を含む側情報信号に使用されるビットをエコノマイズすることができる。
まず,分割モード決定と移動ベクトル選択の特徴を統計的に解析する。
観測された時空間相関に基づいて、上記の側情報を表すオーバーヘッドを低減するモード予測および符号化法を設計する。
主な考え方は、高い選択可能性を持つSTGEOモードと運動候補を予測することであり、これはエントロピー符号化、すなわち予測される高確率モードと少ないビットの運動候補を表現することができる。
特に、隣接するSTGEO符号化ブロックのエッジ情報と履歴モードに基づいて、高確率STGEOモードを予測する。
対応する動作情報は、オフライン訓練されたマージ候補選択確率に基づいて適応的に推測されるマージ候補リストにおいてインデックスで表現される。
シミュレーションの結果,提案手法は平均0.95%と1.98%のビットレートを,GEOを使わずにGEOを使わずに,それぞれVTM-8.0と比較した。
関連論文リスト
- Edge-directed geometric partitioning for versatile video coding [57.010424923769385]
本稿では,GEOのオーバヘッドを低減し,符号化効率を向上させるため,MPM(Most Probable Mode)リストを構築することでGEOモード予測戦略を提案する。
提案手法は, RA LDB の構成に対して VTM-6.0 と比較して平均0.58%, 1.00% の目標 BD レートゲインを提供する。
論文 参考訳(メタデータ) (2026-06-01T03:47:14Z) - Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.91821712591901]
本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。
適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。
提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文 参考訳(メタデータ) (2024-03-18T11:48:20Z) - MMVC: Learned Multi-Mode Video Compression with Block-based Prediction
Mode Selection and Density-Adaptive Entropy Coding [21.147001610347832]
動作パターンに適応した特徴領域予測のための最適モードを選択するマルチモードビデオ圧縮フレームワークを提案する。
エントロピー符号化では、高密度かつスパースな後量子化残差ブロックを考慮し、任意のラン長符号化を適用して圧縮率を向上させる。
現状の映像圧縮方式や標準コーデックと比較すると,PSNRとMS-SSIMで測定したより優れた,あるいは競争的な結果が得られる。
論文 参考訳(メタデータ) (2023-04-05T07:37:48Z) - Neighbor Correspondence Matching for Flow-based Video Frame Synthesis [90.14161060260012]
フローベースフレーム合成のための近傍対応マッチング(NCM)アルゴリズムを提案する。
NCMは現在のフレームに依存しない方法で実行され、各ピクセルの時空間近傍でマルチスケールの対応を確立する。
粗いスケールのモジュールは、近隣の対応を利用して大きな動きを捉えるように設計されている。
論文 参考訳(メタデータ) (2022-07-14T09:17:00Z) - Implicit Motion Handling for Video Camouflaged Object Detection [60.98467179649398]
本稿では,新しいビデオカモフラージュオブジェクト検出(VCOD)フレームワークを提案する。
短期的および長期的整合性を利用して、ビデオフレームからカモフラージュされたオブジェクトを検出する。
論文 参考訳(メタデータ) (2022-03-14T17:55:41Z) - End-to-end Neural Video Coding Using a Compound Spatiotemporal
Representation [33.54844063875569]
本稿では,2つの手法により生成された予測を適応的に組み合わせたハイブリッド動作補償法を提案する。
具体的には、リカレント情報集約(RIA)モジュールを用いて、複合時間表現(STR)を生成する。
さらに、ベクトルベースの再サンプリング、適応カーネルベースの再サンプリング、補償モード選択マップ、テクスチャ拡張を含む、CSTRから複数の予測を生成する1対多デコーダパイプラインを設計する。
論文 参考訳(メタデータ) (2021-08-05T19:43:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。