論文の概要: The Practice of Averaging Rate-Distortion Curves over Testsets to Compare Learned Video Codecs Can Cause Misleading Conclusions
- arxiv url: http://arxiv.org/abs/2409.08772v2
- Date: Tue, 24 Dec 2024 08:18:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:52:11.855170
- Title: The Practice of Averaging Rate-Distortion Curves over Testsets to Compare Learned Video Codecs Can Cause Misleading Conclusions
- Title(参考訳): 学習ビデオコーデックを比較したテストセット上での速度歪み曲線平均化の実践
- Authors: M. Akin Yilmaz, Onur Keleş, A. Murat Tekalp,
- Abstract要約: 平均的な速度歪み曲線が、異なるコーデックの比較評価を誤解させる可能性があることを示す。
テストセットの他の部分と異なるRD特性を持つ単一のビデオは、平均曲線に不均等に影響を及ぼすことができる。
学習したビデオ圧縮コミュニティは、テストセット毎のRD曲線とパフォーマンス指標を報告すべきである。
- 参考スコア(独自算出の注目度): 7.714092783675679
- License:
- Abstract: This paper aims to demonstrate how the prevalent practice in the learned video compression community of averaging rate-distortion (RD) curves across a test video set can lead to misleading conclusions in evaluating codec performance. Through analytical analysis of a simple case and experimental results with two recent learned video codecs, we show how averaged RD curves can mislead comparative evaluation of different codecs, particularly when videos in a dataset have varying characteristics and operating ranges. We illustrate how a single video with distinct RD characteristics from the rest of the test set can disproportionately influence the average RD curve, potentially overshadowing a codec's superior performance across most individual sequences. Using two recent learned video codecs on the UVG dataset as a case study, we demonstrate computing performance metrics, such as the BD rate, from the average RD curve suggests conclusions that contradict those reached from calculating the average of per-sequence metrics. Hence, we argue that the learned video compression community should also report per-sequence RD curves and performance metrics for a test set should be computed from the average of per-sequence metrics, similar to the established practice in traditional video coding, to ensure fair and accurate codec comparisons.
- Abstract(参考訳): 本稿では, 学習ビデオ圧縮コミュニティにおける, 平均速度歪み曲線(RD曲線)が, コーデック性能の評価において, 誤解を招く原因となることを示す。
近年の2つの学習ビデオコーデックによる簡単なケースの解析と実験結果から、平均RD曲線が異なるコーデックの比較評価をいかに誤解させるかを示し、特にデータセット内のビデオが様々な特性と操作範囲を持つ場合について述べる。
テストセットの他の部分と異なるRD特性を持つ1つのビデオが平均RD曲線に不均等に影響を与え、コーデックの優れた性能をほとんどの個々のシーケンスでオーバーシェードする可能性がある。
UVGデータセット上の最近の2つの学習ビデオコーデックをケーススタディとして、平均RD曲線からBDレートなどの計算性能指標を示し、シーケンス毎のメトリクスの平均から到達した結果と矛盾する結論を提示する。
したがって、学習したビデオ圧縮コミュニティは、テストセット毎のRD曲線や性能指標を従来のビデオ符号化の確立した慣行と同様の平均値から計算し、公正かつ正確なコーデック比較を保証する必要がある。
関連論文リスト
- Not All Pairs are Equal: Hierarchical Learning for Average-Precision-Oriented Video Retrieval [80.09819072780193]
平均精度(AP)は、関連ビデオのランキングを上位リストで評価する。
最近のビデオ検索手法は、全てのサンプル対を等しく扱うペアワイズ損失を利用する。
論文 参考訳(メタデータ) (2024-07-22T11:52:04Z) - Hierarchical B-frame Video Coding for Long Group of Pictures [42.229439873835254]
本稿では、フレームの長いシーケンスでのトレーニング、レートアロケーション、推論によるコンテンツ適応を組み合わせたランダムアクセスのためのエンドツーエンドの学習ビデオを提案する。
一般的なテスト条件下では、ビデオのクラスによっては、YUV-PSNR BD-Rateの点でVTMに匹敵する結果が得られる。
平均して、VMAFとYUV BD-Ratesの点で、オープンLDとRAのエンドツーエンドソリューションを上回っている。
論文 参考訳(メタデータ) (2024-06-24T11:29:52Z) - Uncertainty-Aware Deep Video Compression with Ensembles [24.245365441718654]
深層アンサンブルによる予測不確かさを効果的に把握できる不確実性対応ビデオ圧縮モデルを提案する。
我々のモデルは1080pのシーケンスに比べて20%以上効率良くビットを節約できる。
論文 参考訳(メタデータ) (2024-03-28T05:44:48Z) - Towards Debiasing Frame Length Bias in Text-Video Retrieval via Causal
Intervention [72.12974259966592]
トリミングビデオクリップのトレーニングセットとテストセットのフレーム長差による時間偏差について,一意かつ体系的に検討した。
Epic-Kitchens-100, YouCook2, MSR-VTTデータセットについて, 因果脱バイアス法を提案し, 広範な実験およびアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-09-17T15:58:27Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Transfer of Representations to Video Label Propagation: Implementation
Factors Matter [31.030799003595522]
特徴抽出とラベル伝搬における重要な実装要因の影響について検討する。
映像ベースの通信手段を静止画像ベースで拡張することで、さらなる性能向上が期待できることを示す。
本研究は, 評価実践の改善と, 時間的対応における今後の研究方向性の報知に役立つことを期待する。
論文 参考訳(メタデータ) (2022-03-10T18:58:22Z) - End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional
Video Compression [10.885590093103344]
学習VCは、非線形変換、運動、エントロピーモデルのエンドツーエンドの速度歪み(R-D)最適化トレーニングを同時に行うことができる。
本稿では,階層型モーションサンプリングとエンドツーエンド最適化の利点を組み合わせた,学習型階層型双方向ビデオ(LHBDC)を提案する。
論文 参考訳(メタデータ) (2021-12-17T14:30:22Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Objective video quality metrics application to video codecs comparisons:
choosing the best for subjective quality estimation [101.18253437732933]
品質評価は、ビデオ圧縮アルゴリズムの作成と比較において重要な役割を果たす。
比較のために、異なる標準のビデオコーデックでエンコードされた一連のビデオを使用し、2018年から2021年までの一連のストリームに対して、視覚的品質スコアを収集しました。
論文 参考訳(メタデータ) (2021-07-21T17:18:11Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。