論文の概要: The Practice of Averaging Rate-Distortion Curves over Testsets to Compare Learned Video Codecs Can Cause Misleading Conclusions
- arxiv url: http://arxiv.org/abs/2409.08772v2
- Date: Tue, 24 Dec 2024 08:18:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:52:11.855170
- Title: The Practice of Averaging Rate-Distortion Curves over Testsets to Compare Learned Video Codecs Can Cause Misleading Conclusions
- Title(参考訳): 学習ビデオコーデックを比較したテストセット上での速度歪み曲線平均化の実践
- Authors: M. Akin Yilmaz, Onur Keleş, A. Murat Tekalp,
- Abstract要約: 平均的な速度歪み曲線が、異なるコーデックの比較評価を誤解させる可能性があることを示す。
テストセットの他の部分と異なるRD特性を持つ単一のビデオは、平均曲線に不均等に影響を及ぼすことができる。
学習したビデオ圧縮コミュニティは、テストセット毎のRD曲線とパフォーマンス指標を報告すべきである。
- 参考スコア(独自算出の注目度): 7.714092783675679
- License:
- Abstract: This paper aims to demonstrate how the prevalent practice in the learned video compression community of averaging rate-distortion (RD) curves across a test video set can lead to misleading conclusions in evaluating codec performance. Through analytical analysis of a simple case and experimental results with two recent learned video codecs, we show how averaged RD curves can mislead comparative evaluation of different codecs, particularly when videos in a dataset have varying characteristics and operating ranges. We illustrate how a single video with distinct RD characteristics from the rest of the test set can disproportionately influence the average RD curve, potentially overshadowing a codec's superior performance across most individual sequences. Using two recent learned video codecs on the UVG dataset as a case study, we demonstrate computing performance metrics, such as the BD rate, from the average RD curve suggests conclusions that contradict those reached from calculating the average of per-sequence metrics. Hence, we argue that the learned video compression community should also report per-sequence RD curves and performance metrics for a test set should be computed from the average of per-sequence metrics, similar to the established practice in traditional video coding, to ensure fair and accurate codec comparisons.
- Abstract(参考訳): 本稿では, 学習ビデオ圧縮コミュニティにおける, 平均速度歪み曲線(RD曲線)が, コーデック性能の評価において, 誤解を招く原因となることを示す。
近年の2つの学習ビデオコーデックによる簡単なケースの解析と実験結果から、平均RD曲線が異なるコーデックの比較評価をいかに誤解させるかを示し、特にデータセット内のビデオが様々な特性と操作範囲を持つ場合について述べる。
テストセットの他の部分と異なるRD特性を持つ1つのビデオが平均RD曲線に不均等に影響を与え、コーデックの優れた性能をほとんどの個々のシーケンスでオーバーシェードする可能性がある。
UVGデータセット上の最近の2つの学習ビデオコーデックをケーススタディとして、平均RD曲線からBDレートなどの計算性能指標を示し、シーケンス毎のメトリクスの平均から到達した結果と矛盾する結論を提示する。
したがって、学習したビデオ圧縮コミュニティは、テストセット毎のRD曲線や性能指標を従来のビデオ符号化の確立した慣行と同様の平均値から計算し、公正かつ正確なコーデック比較を保証する必要がある。
関連論文リスト
- Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration [11.016119119250765]
本稿では,低遅延構成に基づく従来型および学習型ビデオ符号化手法の比較研究を行う。
その結果, YCbCr 4:2:0色空間におけるAOMおよびMPEG共通試験条件で定義された試験系列について, 公平かつ有意義な比較を行うことができた。
評価結果から,JVETのECMコーデックは,テスト対象のすべてのコーデックの中で,最高の全体的な符号化性能を提供することがわかった。
論文 参考訳(メタデータ) (2024-08-09T12:55:23Z) - Not All Pairs are Equal: Hierarchical Learning for Average-Precision-Oriented Video Retrieval [80.09819072780193]
平均精度(AP)は、関連ビデオのランキングを上位リストで評価する。
最近のビデオ検索手法は、全てのサンプル対を等しく扱うペアワイズ損失を利用する。
論文 参考訳(メタデータ) (2024-07-22T11:52:04Z) - Hierarchical B-frame Video Coding for Long Group of Pictures [42.229439873835254]
本稿では、フレームの長いシーケンスでのトレーニング、レートアロケーション、推論によるコンテンツ適応を組み合わせたランダムアクセスのためのエンドツーエンドの学習ビデオを提案する。
一般的なテスト条件下では、ビデオのクラスによっては、YUV-PSNR BD-Rateの点でVTMに匹敵する結果が得られる。
平均して、VMAFとYUV BD-Ratesの点で、オープンLDとRAのエンドツーエンドソリューションを上回っている。
論文 参考訳(メタデータ) (2024-06-24T11:29:52Z) - Towards Debiasing Frame Length Bias in Text-Video Retrieval via Causal
Intervention [72.12974259966592]
トリミングビデオクリップのトレーニングセットとテストセットのフレーム長差による時間偏差について,一意かつ体系的に検討した。
Epic-Kitchens-100, YouCook2, MSR-VTTデータセットについて, 因果脱バイアス法を提案し, 広範な実験およびアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-09-17T15:58:27Z) - Video Compression with Arbitrary Rescaling Network [8.489428003916622]
符号化前のビデオリサイズのためのレート誘導任意再スケーリングネットワーク(RARN)を提案する。
軽量RARN構造は、FHD(1080p)コンテンツをリアルタイム(91 FPS)で処理し、かなりのレート低下を得ることができる。
論文 参考訳(メタデータ) (2023-06-07T07:15:18Z) - Video compression dataset and benchmark of learning-based video-quality
metrics [55.41644538483948]
本稿では,ビデオ圧縮の評価を行うビデオ品質指標の新しいベンチマークを提案する。
これは、異なる標準でエンコードされた約2,500のストリームからなる、新しいデータセットに基づいている。
クラウドソーシングによるペアワイズ比較により,主観的スコアを収集した。
論文 参考訳(メタデータ) (2022-11-22T09:22:28Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Objective video quality metrics application to video codecs comparisons:
choosing the best for subjective quality estimation [101.18253437732933]
品質評価は、ビデオ圧縮アルゴリズムの作成と比較において重要な役割を果たす。
比較のために、異なる標準のビデオコーデックでエンコードされた一連のビデオを使用し、2018年から2021年までの一連のストリームに対して、視覚的品質スコアを収集しました。
論文 参考訳(メタデータ) (2021-07-21T17:18:11Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。