論文の概要: Multiview Video Compression Using Advanced HEVC Screen Content Coding
- arxiv url: http://arxiv.org/abs/2106.13574v1
- Date: Fri, 25 Jun 2021 11:53:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-28 18:34:25.125244
- Title: Multiview Video Compression Using Advanced HEVC Screen Content Coding
- Title(参考訳): HEVC画面コンテンツ符号化によるマルチビュー映像圧縮
- Authors: Jaros{\l}aw Samelak, Marek Doma\'nski
- Abstract要約: 本稿では,マルチビュー映像符号化において,スクリーンコンテンツ符号化が効果的に利用できることを示す。
提案されているAdvanced Screen Content CodingはMV-HEVCとほぼ同等のコーディング効率を提供する。
- 参考スコア(独自算出の注目度): 1.0660480034605242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper presents a new approach to multiview video coding using Screen
Content Coding. It is assumed that for a time instant the frames corresponding
to all views are packed into a single frame, i.e. the frame-compatible approach
to multiview coding is applied. For such coding scenario, the paper
demonstrates that Screen Content Coding can be efficiently used for multiview
video coding. Two approaches are considered: the first using standard HEVC
Screen Content Coding, and the second using Advanced Screen Content Coding. The
latter is the original proposal of the authors that exploits quarter-pel motion
vectors and other nonstandard extensions of HEVC Screen Content Coding. The
experimental results demonstrate that multiview video coding even using
standard HEVC Screen Content Coding is much more efficient than simulcast HEVC
coding. The proposed Advanced Screen Content Coding provides virtually the same
coding efficiency as MV-HEVC, which is the state-of-the-art multiview video
compression technique. The authors suggest that Advanced Screen Content Coding
can be efficiently used within the new Versatile Video Coding (VVC) technology.
Nevertheless a reference multiview extension of VVC does not exist yet,
therefore, for VVC-based coding, the experimental comparisons are left for
future work.
- Abstract(参考訳): 本稿では,スクリーンコンテンツ符号化を用いたマルチビュー映像符号化手法を提案する。
一瞬の間、すべてのビューに対応するフレームが単一のフレームに詰め込まれていると仮定される。
マルチビュー符号化へのフレーム互換アプローチが適用される。
このようなコーディングシナリオに対して,マルチビュー映像符号化にスクリーンコンテンツ符号化が有効であることを示す。
2つのアプローチが検討されている: 1つは標準hevcスクリーンコンテンツコーディング、もう1つは高度なスクリーンコンテンツコーディングである。
後者は、HEVCスクリーンコンテンツ符号化の4分の1のモーションベクトルや他の非標準拡張を利用する著者の原案である。
実験結果から,標準的なHEVC画面コンテンツ符号化を用いたマルチビュー映像符号化の方が,HEVC符号化のシミュレートよりもはるかに効率的であることが示された。
提案したAdvanced Screen Content Codingは、最先端のマルチビュービデオ圧縮技術であるMV-HEVCとほぼ同等の符号化効率を提供する。
著者らは、新しいVersatile Video Coding(VVC)技術で、Advanced Screen Content Codingを効率的に利用できることを示唆している。
しかしながら、vvcの参照マルチビュー拡張はまだ存在しないため、vvcベースのコーディングでは、将来の作業のために実験的な比較が残されている。
関連論文リスト
- When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding [112.44822009714461]
CMVC(Cross-Modality Video Coding)は、ビデオ符号化における多モード表現とビデオ生成モデルを探索する先駆的な手法である。
復号化の際には、以前に符号化されたコンポーネントとビデオ生成モデルを利用して複数の復号モードを生成する。
TT2Vは効果的な意味再構成を実現し,IT2Vは競争力のある知覚整合性を示した。
論文 参考訳(メタデータ) (2024-08-15T11:36:18Z) - Composed Video Retrieval via Enriched Context and Discriminative Embeddings [118.66322242183249]
コンポジションビデオ検索(CoVR)はコンピュータビジョンにおいて難しい問題である。
本稿では,クエリ固有のコンテキスト情報を明示的にエンコードするために,詳細な言語記述を活用する新しいCoVRフレームワークを提案する。
我々の手法はリコール@K=1のスコアで7%の上昇を達成した。
論文 参考訳(メタデータ) (2024-03-25T17:59:03Z) - NN-VVC: Versatile Video Coding boosted by self-supervisedly learned
image coding for machines [19.183883119933558]
本稿では, NN-VVC という, E2E 学習画像と CVC の利点を組み合わせて, 画像符号化と映像符号化の両面において高い性能を実現するマシン用ハイブリッドを提案する。
実験の結果,提案システムは画像データとビデオデータのVVCよりも最大で-43.20%,-26.8%のBjontegaard Deltaレート低下を達成した。
論文 参考訳(メタデータ) (2024-01-19T15:33:46Z) - VVC Extension Scheme for Object Detection Using Contrast Reduction [0.0]
Versatile Video Coding (VVC) を用いたオブジェクト検出のためのビデオ符号化の拡張方式を提案する。
提案方式では,元の画像のサイズとコントラストを小さくし,VVCエンコーダで符号化して高圧縮性能を実現する。
実験結果から,提案手法はオブジェクト検出精度の点で,通常のVVCよりも優れた符号化性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-30T06:29:04Z) - HAAV: Hierarchical Aggregation of Augmented Views for Image Captioning [25.728621355173626]
本稿では,エンコーディングを入力画像の拡張ビューとみなす。
画像キャプションモデルは、共有エンコーダと独立して各ビューをエンコードする。
我々は,MS-COCOでは+5.6%,Flickr30kでは+12.9%の性能向上を示す。
論文 参考訳(メタデータ) (2023-05-25T17:50:17Z) - Contrastive Masked Autoencoders for Self-Supervised Video Hashing [54.636976693527636]
SSVH(Self-Supervised Video Hashing)モデルは,ビデオの短いバイナリ表現を生成することを学ぶ。
本稿では,映像意味情報と映像類似性関係理解を組み込んだ,シンプルで効果的なワンステージSSVH手法であるConMHを提案する。
論文 参考訳(メタデータ) (2022-11-21T06:48:14Z) - PIC 4th Challenge: Semantic-Assisted Multi-Feature Encoding and
Multi-Head Decoding for Dense Video Captioning [46.69503728433432]
本稿では,符号化・復号化フレームワークに基づく意味支援型高密度ビデオキャプションモデルを提案する。
本手法は,評価中のYouMakeupデータセットの大幅な改善を実現する。
論文 参考訳(メタデータ) (2022-07-06T10:56:53Z) - End-to-End Dense Video Captioning with Parallel Decoding [53.34238344647624]
パラレルデコーディング(PDVC)を用いたエンドツーエンドの高精細動画キャプションのための簡易かつ効果的なフレームワークを提案する。
PDVCは、ビデオをビデオの内容の全体的理解の下で、正確にいくつかのイベントに分類する。
ActivityNet CaptionsとYouCook2の実験は、PDVCが高品質なキャプション結果を生成することができることを示している。
論文 参考訳(メタデータ) (2021-08-17T17:39:15Z) - Multitask Learning for VVC Quality Enhancement and Super-Resolution [11.446576112498596]
デコードされたVVCビデオ品質を高めるための後処理のステップとして学習ベースのソリューションを提案します。
提案手法はマルチタスク学習に依存し,複数のレベルに最適化された1つの共有ネットワークを用いて品質向上と超解像化を実現する。
論文 参考訳(メタデータ) (2021-04-16T19:05:26Z) - Dual Encoding for Video Retrieval by Text [49.34356217787656]
本稿では,ビデオやクエリを独自の高密度表現に符号化する2つのディープエンコーディングネットワークを提案する。
まず、特定のシングルレベルエンコーダを利用する先行技術と異なり、提案するネットワークはマルチレベルエンコーダを実行する。
第2に、概念ベースまたは潜在空間ベースのいずれかである従来の共通空間学習アルゴリズムとは異なり、ハイブリッド空間学習を導入する。
論文 参考訳(メタデータ) (2020-09-10T15:49:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。