論文の概要: Efficient Motion Modelling with Variable-sized blocks from Hierarchical
Cuboidal Partitioning
- arxiv url: http://arxiv.org/abs/2208.13137v1
- Date: Sun, 28 Aug 2022 04:13:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 14:34:35.304416
- Title: Efficient Motion Modelling with Variable-sized blocks from Hierarchical
Cuboidal Partitioning
- Title(参考訳): 階層立方体分割による可変サイズブロックを用いた効率的な運動モデル
- Authors: Priyabrata Karmakar, Manzur Murshed, Manoranjan Paul, David Taubman
- Abstract要約: ブロックベースアーキテクチャを用いたモーションモデリングは、フレームを独立して補償される固定サイズのブロックに分割するビデオ符号化において広く用いられている。
我々は、スケーラブルなビデオ符号化に使用される固定サイズのブロックに対して、動きモデリングにおける立方体の可能性について検討した。
- 参考スコア(独自算出の注目度): 24.100530697346155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motion modelling with block-based architecture has been widely used in video
coding where a frame is divided into fixed-sized blocks that are motion
compensated independently. This often leads to coding inefficiency as
fixed-sized blocks hardly align with the object boundaries. Although
hierarchical block-partitioning has been introduced to address this, the
increased number of motion vectors limits the benefit. Recently, approximate
segmentation of images with cuboidal partitioning has gained popularity. Not
only are the variable-sized rectangular segments (cuboids) readily amenable to
block-based image/video coding techniques, but they are also capable of
aligning well with the object boundaries. This is because cuboidal partitioning
is based on a homogeneity constraint, minimising the sum of squared errors
(SSE). In this paper, we have investigated the potential of cuboids in motion
modelling against the fixed-sized blocks used in scalable video coding.
Specifically, we have constructed motion-compensated current frame using the
cuboidal partitioning information of the anchor frame in a group-of-picture
(GOP). The predicted current frame has then been used as the base layer while
encoding the current frame as an enhancement layer using the scalable HEVC
encoder. Experimental results confirm 6.71%-10.90% bitrate savings on 4K video
sequences.
- Abstract(参考訳): ブロックベースアーキテクチャを用いたモーションモデリングは、フレームを独立して補償される固定サイズのブロックに分割するビデオ符号化において広く用いられている。
これはしばしば、固定サイズのブロックがオブジェクトの境界とほとんど一致しないため、コーディングの非効率につながる。
これに対処するために階層的ブロックパーティショニングが導入されたが、動きベクトルの増加は効果を制限している。
近年,cuboidal partitioningを用いた画像の近似セグメンテーションが普及している。
可変長方形セグメント(cuboids)はブロックベースの画像/ビデオ符号化技術に容易に適合するだけでなく、オブジェクト境界とうまく整合することができる。
これは、立方体分割は二乗誤差の和 (sse) を最小化する同質性制約に基づいているからである。
本稿では,スケーラブルなビデオ符号化において使用される固定サイズのブロックに対する動きモデリングにおけるcuboidsの可能性について検討した。
具体的には,グループ・オブ・ピクチャ(GOP)におけるアンカーフレームの立方体分割情報を用いて,動作補償電流フレームを構築した。
その後、予測された現在のフレームをベース層として使用し、スケーラブルなHEVCエンコーダを用いて、現在のフレームを拡張層として符号化する。
6.71%-10.90%のビットレート保存を4Kビデオシーケンスで確認した。
関連論文リスト
- Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.91821712591901]
本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。
適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。
提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文 参考訳(メタデータ) (2024-03-18T11:48:20Z) - IBVC: Interpolation-driven B-frame Video Compression [68.18440522300536]
Bフレームビデオ圧縮は、双方向動作推定と動き補償(MEMC)符号化をミドルフレーム再構成に適用することを目的としている。
従来の学習アプローチでは、しばしば双方向の光フロー推定に依存するニューラルネットワークのPフレームコーデックをBフレームに直接拡張する。
これらの問題に対処するために,IBVC (Interpolation-B-frame Video Compression) という単純な構造を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:45:51Z) - H-VFI: Hierarchical Frame Interpolation for Videos with Large Motions [63.23985601478339]
本稿では,ビデオフレームにおける大きな動きに対処する,単純で効果的なH-VFI法を提案する。
H-VFIは、粗大な戦略で変形可能なカーネルを学習するために階層型ビデオ変換器に寄与する。
このようなプログレッシブ近似の利点は、大きなモーションフレーム問題を比較的単純ないくつかのサブタスクに予測できることである。
論文 参考訳(メタデータ) (2022-11-21T09:49:23Z) - Neighbor Correspondence Matching for Flow-based Video Frame Synthesis [90.14161060260012]
フローベースフレーム合成のための近傍対応マッチング(NCM)アルゴリズムを提案する。
NCMは現在のフレームに依存しない方法で実行され、各ピクセルの時空間近傍でマルチスケールの対応を確立する。
粗いスケールのモジュールは、近隣の対応を利用して大きな動きを捉えるように設計されている。
論文 参考訳(メタデータ) (2022-07-14T09:17:00Z) - Contributions to interframe coding [0.0]
画像の局所特性の関数として,異なるブロックサイズを用いて,ベクトル数を削減できる新しい手法を提案する。
第2のアルゴリズムは、フレーム間/イントラフレームコーダに対して提案される。
論文 参考訳(メタデータ) (2022-03-31T10:36:25Z) - Exploring Motion Ambiguity and Alignment for High-Quality Video Frame
Interpolation [46.02120172459727]
本稿では,GTに近い中間フレームを可能な限り再構築する要件を緩和することを提案する。
本研究では,テクスチャ整合性損失 (TCL) を補間されたコンテンツが,与えられたフレーム内でのテクスチャ整合性損失 (TCL) と類似した構造を維持するべきであるという仮定に基づいて開発する。
論文 参考訳(メタデータ) (2022-03-19T10:37:06Z) - Self-Supervised Learning of Perceptually Optimized Block Motion
Estimates for Video Compression [50.48504867843605]
多段階畳み込みニューラルネットワークを用いた探索自由ブロック運動推定フレームワークを提案する。
動作補償フレームの知覚品質を最適化するために,マルチスケール構造類似度(MS-SSIM)損失関数をデプロイする。
論文 参考訳(メタデータ) (2021-10-05T03:38:43Z) - Efficient Video Object Segmentation with Compressed Video [36.192735485675286]
ビデオの時間的冗長性を利用した半教師付きビデオオブジェクトセグメンテーションのための効率的なフレームワークを提案する。
提案手法は,圧縮したビデオビットストリームの動作と残差に基づいて,選択したベクトルの推測を行い,他のフレームの予測を行う。
ベースモデルとしてトップkフィルタリングを用いたSTMでは,DAVIS16とYouTube-VOSにおいて,精度の低下とともに最大4.9倍の高速化を実現した。
論文 参考訳(メタデータ) (2021-07-26T12:57:04Z) - SegBlocks: Block-Based Dynamic Resolution Networks for Real-Time
Segmentation [47.338987325018614]
SegBlocksは、その複雑さに基づいて、画像領域の処理解像度を動的に調整する。
複雑な領域を選択する軽量なポリシーネットワークを強化学習を用いて訓練する。
提案手法は,SwiftNet-RN18の浮動小数点演算数を60%削減し,推論速度を50%向上させる。
論文 参考訳(メタデータ) (2020-11-24T11:05:07Z) - Blurry Video Frame Interpolation [57.77512131536132]
本稿では,ぼやけた動きとアップコンバートのフレームレートを同時に低減する,ぼやけたビデオフレーム手法を提案する。
具体的には、透明な中間フレームを循環的に合成するピラミッドモジュールを開発する。
我々の手法は最先端の手法に対して好適に機能する。
論文 参考訳(メタデータ) (2020-02-27T17:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。