論文の概要: OpenDVC: An Open Source Implementation of the DVC Video Compression
Method
- arxiv url: http://arxiv.org/abs/2006.15862v2
- Date: Mon, 3 Aug 2020 18:45:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 15:06:29.813304
- Title: OpenDVC: An Open Source Implementation of the DVC Video Compression
Method
- Title(参考訳): OpenDVC:DVCビデオ圧縮法のオープンソース実装
- Authors: Ren Yang, Luc Van Gool, Radu Timofte
- Abstract要約: 本稿では,Deep Video Compression(DVC)手法のオープンソース・フロー実装について紹介する。
MS-SSIMは、x265の非常に高速な設定である低遅延P(LDP)よりも優れたMS-SSIM性能を実現する最初のエンドツーエンド最適化ビデオ圧縮方式である。
我々のOpenDVC(MS-SSIM)モデルは、過去に最適化されたPSNRとしか比較できないMS-SSIM最適化手法に対して、より説得力のあるベースラインを提供する。
- 参考スコア(独自算出の注目度): 177.67218448278143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an open source Tensorflow implementation of the Deep Video
Compression (DVC) method in this technical report. DVC is the first end-to-end
optimized learned video compression method, achieving better MS-SSIM
performance than the Low-Delay P (LDP) very fast setting of x265 and comparable
PSNR performance with x265 (LDP very fast). At the time of writing this report,
several learned video compression methods are superior to DVC, but currently
none of them provides open source codes. We hope that our OpenDVC codes are
able to provide a useful model for further development, and facilitate future
researches on learned video compression. Different from the original DVC, which
is only optimized for PSNR, we release not only the PSNR-optimized
re-implementation, denoted by OpenDVC (PSNR), but also the MS-SSIM-optimized
model OpenDVC (MS-SSIM). Our OpenDVC (MS-SSIM) model provides a more convincing
baseline for MS-SSIM optimized methods, which can only compare with the PSNR
optimized DVC in the past. The OpenDVC source codes and pre-trained models are
publicly released at https://github.com/RenYang-home/OpenDVC.
- Abstract(参考訳): 本稿では,Deep Video Compression(DVC)方式のオープンソースTensorflowの実装について紹介する。
DVCは、x265(LDP)の非常に高速な設定と、x265(LDP)と同等のPSNR性能(LDP)の非常に高速な設定よりも優れたMS-SSIM性能を実現する、エンドツーエンドで最適化された最初のビデオ圧縮手法である。
このレポートを書く時点では、いくつかの学習ビデオ圧縮手法がDVCよりも優れているが、現時点ではオープンソースコードを提供していない。
弊社のOpenDVCコードは、さらなる開発に有用なモデルを提供し、学習ビデオ圧縮に関する今後の研究を促進することを願っている。
また,PSNRに最適化されたオリジナルのDVCと異なり,PSNRに最適化された再実装だけでなく,MS-SSIMに最適化されたモデルOpenDVC(MS-SSIM)もリリースしている。
我々のOpenDVC(MS-SSIM)モデルは、過去にPSNR最適化DVCとしか比較できないMS-SSIM最適化手法に対して、より説得力のあるベースラインを提供する。
OpenDVCのソースコードと事前訓練されたモデルはhttps://github.com/RenYang-home/OpenDVCで公開されている。
関連論文リスト
- NVRC: Neural Video Representation Compression [13.131842990481038]
我々は、新しいINRベースのビデオ圧縮フレームワーク、Neural Video Representation Compression (NVRC)を提案する。
NVRCは初めて、INRベースのビデオをエンドツーエンドで最適化することができる。
実験の結果,NVRCは従来のベンチマークエントロピーよりも優れていた。
論文 参考訳(メタデータ) (2024-09-11T16:57:12Z) - Hierarchical B-frame Video Coding for Long Group of Pictures [42.229439873835254]
本稿では、フレームの長いシーケンスでのトレーニング、レートアロケーション、推論によるコンテンツ適応を組み合わせたランダムアクセスのためのエンドツーエンドの学習ビデオを提案する。
一般的なテスト条件下では、ビデオのクラスによっては、YUV-PSNR BD-Rateの点でVTMに匹敵する結果が得られる。
平均して、VMAFとYUV BD-Ratesの点で、オープンLDとRAのエンドツーエンドソリューションを上回っている。
論文 参考訳(メタデータ) (2024-06-24T11:29:52Z) - SF-V: Single Forward Video Generation Model [57.292575082410785]
そこで本稿では,単段階ビデオ生成モデルを得るための新しい手法を提案する。
実験により,提案手法は計算オーバーヘッドを大幅に低減した合成ビデオの競合生成品質を実現することを示す。
論文 参考訳(メタデータ) (2024-06-06T17:58:27Z) - Building an Open-Vocabulary Video CLIP Model with Better Architectures,
Optimization and Data [102.0069667710562]
本稿では,CLIPを強力なゼロショットビデオ分類器に適応させるフレームワークであるOpen-VCLIP++を提案する。
我々は,Open-VCLIP++のトレーニングが,履歴データゼロで連続的な学習に欠かせないことを実証した。
提案手法は,広く使用されている3つの行動認識データセットを用いて評価する。
論文 参考訳(メタデータ) (2023-10-08T04:46:43Z) - End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional
Video Compression [10.885590093103344]
学習VCは、非線形変換、運動、エントロピーモデルのエンドツーエンドの速度歪み(R-D)最適化トレーニングを同時に行うことができる。
本稿では,階層型モーションサンプリングとエンドツーエンド最適化の利点を組み合わせた,学習型階層型双方向ビデオ(LHBDC)を提案する。
論文 参考訳(メタデータ) (2021-12-17T14:30:22Z) - DVC-P: Deep Video Compression with Perceptual Optimizations [22.54270922884164]
本稿では,Deep Video compression with Perceptual Optimizations (DVC-P)を提案する。
具体的には、ネットワークの歪み、知覚、レートのトレードオフを支援するために、識別器ネットワークと混合損失を用いる。
論文 参考訳(メタデータ) (2021-09-22T17:20:13Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - ELF-VC: Efficient Learned Flexible-Rate Video Coding [61.10102916737163]
低レイテンシモードの性能向上を実現するための,学習ビデオ圧縮のための新しいアイデアをいくつか提案する。
一般的なビデオテストセット UVG と MCL-JCV 上で,ELF-VC と呼ぶ手法をベンチマークする。
我々の手法は少なくとも5倍高速に動作し、これらの数値を報告するすべてのMLコーデックよりもパラメータが少ない。
論文 参考訳(メタデータ) (2021-04-29T17:50:35Z) - Efficient Video Compression via Content-Adaptive Super-Resolution [11.6624528293976]
ビデオ圧縮はインターネットビデオ配信の重要なコンポーネントである。
近年の研究では、ディープラーニング技術が人間のアルゴリズムに匹敵する、あるいは優れていることが示されている。
本稿では,最近の深層学習に基づくビデオ圧縮方式を補強する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-04-06T07:01:06Z) - Learning for Video Compression with Recurrent Auto-Encoder and Recurrent
Probability Model [164.7489982837475]
本稿では、リカレントオートエンコーダ(RAE)とリカレント確率モデル(RPM)を用いたリカレントラーニングビデオ圧縮(RLVC)手法を提案する。
RAEは、ビデオフレーム間の時間的相関を利用するために、エンコーダとデコーダの両方で繰り返しセルを使用する。
提案手法は,PSNRとMS-SSIMの両方の観点から,最先端の学習ビデオ圧縮性能を実現する。
論文 参考訳(メタデータ) (2020-06-24T08:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。