論文の概要: OpenDCVCs: A PyTorch Open Source Implementation and Performance Evaluation of the DCVC series Video Codecs
- arxiv url: http://arxiv.org/abs/2508.04491v1
- Date: Wed, 06 Aug 2025 14:39:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.766362
- Title: OpenDCVCs: A PyTorch Open Source Implementation and Performance Evaluation of the DCVC series Video Codecs
- Title(参考訳): OpenDCVCs:DCVCシリーズのビデオコーデックのPyTorchオープンソース実装と性能評価
- Authors: Yichi Zhang, Fengqing Zhu,
- Abstract要約: 我々は,学習ビデオ圧縮における再現可能な研究を進めるために,オープンソースのPyTorch実装であるOpenDCVCを提案する。
OpenDCVCsは、4つの代表的なDeep Contextual Video Compression (DCVC)モデルの統一的でトレーニング可能な実装を提供する。
- 参考スコア(独自算出の注目度): 12.190794711534872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present OpenDCVCs, an open-source PyTorch implementation designed to advance reproducible research in learned video compression. OpenDCVCs provides unified and training-ready implementations of four representative Deep Contextual Video Compression (DCVC) models--DCVC, DCVC with Temporal Context Modeling (DCVC-TCM), DCVC with Hybrid Entropy Modeling (DCVC-HEM), and DCVC with Diverse Contexts (DCVC-DC). While the DCVC series achieves substantial bitrate reductions over both classical codecs and advanced learned models, previous public code releases have been limited to evaluation codes, presenting significant barriers to reproducibility, benchmarking, and further development. OpenDCVCs bridges this gap by offering a comprehensive, self-contained framework that supports both end-to-end training and evaluation for all included algorithms. The implementation includes detailed documentation, evaluation protocols, and extensive benchmarking results across diverse datasets, providing a transparent and consistent foundation for comparison and extension. All code and experimental tools are publicly available at https://gitlab.com/viper-purdue/opendcvcs, empowering the community to accelerate research and foster collaboration.
- Abstract(参考訳): 我々は,学習ビデオ圧縮における再現可能な研究を促進するために,オープンソースのPyTorch実装であるOpenDCVCを提案する。
OpenDCVCsは、DCVC(Deep Contextual Video Compression)モデルの4つの代表的なDCVC、DCVC with Temporal Context Modeling (DCVC-TCM)、DCVC with Hybrid Entropy Modeling (DCVC-HEM)、DCVC with Diverse Contexts (DCVC-DC)の統一的で訓練可能な実装を提供する。
DCVCシリーズは古典的コーデックと高度な学習モデルの両方でビットレートの大幅な削減を実現しているが、以前の公開コードのリリースは評価コードに限られており、再現性、ベンチマーク、さらなる開発への大きな障壁が提示されている。
OpenDCVCは、エンド・ツー・エンドのトレーニングとすべてのアルゴリズムの評価をサポートする包括的な自己完結型のフレームワークを提供することで、このギャップを埋める。
実装には詳細なドキュメント、評価プロトコル、さまざまなデータセットにわたる広範なベンチマーク結果が含まれており、比較と拡張のための透明で一貫した基盤を提供する。
すべてのコードと実験ツールがhttps://gitlab.com/viper-purdue/opendcvcsで公開されている。
関連論文リスト
- Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration [11.016119119250765]
本稿では,低遅延構成に基づく従来型および学習型ビデオ符号化手法の比較研究を行う。
その結果, YCbCr 4:2:0色空間におけるAOMおよびMPEG共通試験条件で定義された試験系列について, 公平かつ有意義な比較を行うことができた。
評価結果から,JVETのECMコーデックは,テスト対象のすべてのコーデックの中で,最高の全体的な符号化性能を提供することがわかった。
論文 参考訳(メタデータ) (2024-08-09T12:55:23Z) - Deep Video Restoration for Under-Display Camera [98.17505013737446]
本稿では,現実的な UDC 劣化過程をシミュレートする GAN ベースの生成パイプラインを提案する。
我々は PexelsUDC という,最初の大規模 UDC ビデオ復元データセットを構築した。
本稿では,動画の劣化を適応的に改善するトランスフォーマーベースライン手法を提案する。
論文 参考訳(メタデータ) (2023-09-09T10:48:06Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - CANF-VC: Conditional Augmented Normalizing Flows for Video Compression [81.41594331948843]
CANF-VCは、エンドツーエンドの学習ベースのビデオ圧縮システムである。
条件付き拡張正規化フロー(ANF)に基づく。
論文 参考訳(メタデータ) (2022-07-12T04:53:24Z) - Efficient VVC Intra Prediction Based on Deep Feature Fusion and
Probability Estimation [57.66773945887832]
本稿では,フレーム内予測におけるVersatile Video Coding (VVC) の複雑性を,深層融合と確率推定の2段階のフレームワークを用いて最適化することを提案する。
特に高精細度(HD)および超高精細度(UHD)ビデオシーケンスにおいて,提案手法の優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-05-07T08:01:32Z) - AIVC: Artificial Intelligence based Video Codec [2.410573852722981]
AIVCはエンドツーエンドのニューラルビデオシステムである。
ビデオの圧縮は、どんなコード構成でも学べる。
これは、最近のビデオコーダHEVCとパフォーマンスの競争力を提供する。
論文 参考訳(メタデータ) (2022-02-09T10:03:12Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Video Abnormal Event Detection by Learning to Complete Visual Cloze
Tests [50.1446994599891]
ビデオ異常事象(VAD)は、大まかにラベル付けされた通常のビデオでのみ学習を必要とする、重要な半教師付きタスクである。
本稿では,視覚的クローゼテスト(VCT)の完了を学習することで,視覚的クローゼ(VCC)という新しいアプローチを提案する。
我々はVCCが最先端のVAD性能を達成することを示す。
論文 参考訳(メタデータ) (2021-08-05T04:05:36Z) - OpenDVC: An Open Source Implementation of the DVC Video Compression
Method [177.67218448278143]
本稿では,Deep Video Compression(DVC)手法のオープンソース・フロー実装について紹介する。
MS-SSIMは、x265の非常に高速な設定である低遅延P(LDP)よりも優れたMS-SSIM性能を実現する最初のエンドツーエンド最適化ビデオ圧縮方式である。
我々のOpenDVC(MS-SSIM)モデルは、過去に最適化されたPSNRとしか比較できないMS-SSIM最適化手法に対して、より説得力のあるベースラインを提供する。
論文 参考訳(メタデータ) (2020-06-29T08:22:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。