論文の概要: Full Reference Video Quality Assessment for Machine Learning-Based Video
Codecs
- arxiv url: http://arxiv.org/abs/2309.00769v1
- Date: Sat, 2 Sep 2023 00:32:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 01:14:01.237314
- Title: Full Reference Video Quality Assessment for Machine Learning-Based Video
Codecs
- Title(参考訳): 機械学習を用いたビデオコーデックのフルリファレンスビデオ品質評価
- Authors: Abrar Majeedi, Babak Naderi, Yasaman Hosseinkashi, Juhee Cho, Ruben
Alvarez Martinez, Ross Cutler
- Abstract要約: DSPをベースとしたビデオコーデックを設計・訓練した既存の評価指標は,MLビデオコーデックを用いた場合の主観的評価と強く相関しないことを示す。
モデルレベルではピアソン相関係数0.99、スピアマンランク相関係数0.99を達成する新しいフルリファレンスビデオ品質評価(FRVQA)モデルを提案する。
- 参考スコア(独自算出の注目度): 12.024300171633758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning-based video codecs have made significant progress in the
past few years. A critical area in the development of ML-based video codecs is
an accurate evaluation metric that does not require an expensive and slow
subjective test. We show that existing evaluation metrics that were designed
and trained on DSP-based video codecs are not highly correlated to subjective
opinion when used with ML video codecs due to the video artifacts being quite
different between ML and video codecs. We provide a new dataset of ML video
codec videos that have been accurately labeled for quality. We also propose a
new full reference video quality assessment (FRVQA) model that achieves a
Pearson Correlation Coefficient (PCC) of 0.99 and a Spearman's Rank Correlation
Coefficient (SRCC) of 0.99 at the model level. We make the dataset and FRVQA
model open source to help accelerate research in ML video codecs, and so that
others can further improve the FRVQA model.
- Abstract(参考訳): 機械学習ベースのビデオコーデックは、ここ数年で大きな進歩を遂げている。
MLベースのビデオコーデックの開発において重要な領域は、高価で遅い主観的テストを必要としない正確な評価基準である。
DSPをベースとしたビデオコーデックを設計・訓練した既存の評価指標は、MLとビデオコーデックとは全く異なるため、MLビデオコーデックを使用する場合の主観的意見と強く相関しないことを示す。
品質のために正確にラベル付けされたmlビデオコーデックビデオの新しいデータセットを提供する。
また,Pearson correlation Coefficient (PCC) の0.99, Spearman's Rank correlation Coefficient (SRCC) の0.99をモデルレベルで達成する新しいフルリファレンスビデオ品質評価(FRVQA)モデルを提案する。
我々は、データセットとFRVQAモデルをオープンソースにして、MLビデオコーデックの研究を加速させ、他の人がFRVQAモデルをさらに改善できるようにします。
関連論文リスト
- MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding [67.56182262082729]
本稿では,ビデオ理解において大規模視覚言語モデル(LVLM)を厳格に評価するための定量的なベンチマークであるMMBench-Videoを紹介する。
MMBench-VideoにはYouTubeの長いビデオが組み込まれており、フリーフォームの質問を採用し、実用的なユースケースを反映している。
ベンチマークは、慎重に構築された能力の分類に従って人間に注釈を付けることで、モデルの時間的推論スキルを調査するために慎重に作成されている。
論文 参考訳(メタデータ) (2024-06-20T17:26:01Z) - Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs [20.168429351519055]
ビデオ理解はマルチモーダル大言語モデル(LMLM)にとって重要な次のステップである
合成ビデオ生成によるベンチマーク構築フレームワークであるVideoNIAH(Video Needle In A Haystack)を提案する。
我々は、プロプライエタリモデルとオープンソースモデルの両方を包括的に評価し、ビデオ理解能力の重大な違いを明らかにする。
論文 参考訳(メタデータ) (2024-06-13T17:50:05Z) - Knowledge Guided Semi-Supervised Learning for Quality Assessment of User
Generated Videos [9.681456357957819]
ビデオの品質を意識したロバストな機能を生成するための自己教師型フレームワークを設計する。
次に,ビデオ品質評価タスクに特化して設計された,デュアルモデルに基づくSemi Supervised Learning(SSL)手法を提案する。
我々のSSL-VQAメソッドはST-VQRLバックボーンを使用して、様々なVQAデータセット間で堅牢なパフォーマンスを生成する。
本モデルでは,制限データのみをトレーニングした場合の最先端性能を約10%向上させ,SSLでも未使用データを使用すれば約15%向上させる。
論文 参考訳(メタデータ) (2023-12-24T07:32:03Z) - LSTM-based Video Quality Prediction Accounting for Temporal Distortions
in Videoconferencing Calls [22.579711841384764]
クラウドソーシングによってラベル付けされた主観的品質評価を用いてLSTMをトレーニングすることにより,このような歪みを自動的にモデル化するデータ駆動型手法を提案する。
ソースビデオにQRコードをマーカとして適用し、アライメントベクトルに基づいてアライメント参照を作成し、時間的特徴を計算する。
提案モデルでは,検証セット上で0.99のPCCを実現し,映像品質障害の原因について詳細な知見を提供する。
論文 参考訳(メタデータ) (2023-03-22T17:14:38Z) - Video compression dataset and benchmark of learning-based video-quality
metrics [55.41644538483948]
本稿では,ビデオ圧縮の評価を行うビデオ品質指標の新しいベンチマークを提案する。
これは、異なる標準でエンコードされた約2,500のストリームからなる、新しいデータセットに基づいている。
クラウドソーシングによるペアワイズ比較により,主観的スコアを収集した。
論文 参考訳(メタデータ) (2022-11-22T09:22:28Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Objective video quality metrics application to video codecs comparisons:
choosing the best for subjective quality estimation [101.18253437732933]
品質評価は、ビデオ圧縮アルゴリズムの作成と比較において重要な役割を果たす。
比較のために、異なる標準のビデオコーデックでエンコードされた一連のビデオを使用し、2018年から2021年までの一連のストリームに対して、視覚的品質スコアを収集しました。
論文 参考訳(メタデータ) (2021-07-21T17:18:11Z) - ELF-VC: Efficient Learned Flexible-Rate Video Coding [61.10102916737163]
低レイテンシモードの性能向上を実現するための,学習ビデオ圧縮のための新しいアイデアをいくつか提案する。
一般的なビデオテストセット UVG と MCL-JCV 上で,ELF-VC と呼ぶ手法をベンチマークする。
我々の手法は少なくとも5倍高速に動作し、これらの数値を報告するすべてのMLコーデックよりもパラメータが少ない。
論文 参考訳(メタデータ) (2021-04-29T17:50:35Z) - UGC-VQA: Benchmarking Blind Video Quality Assessment for User Generated
Content [59.13821614689478]
コンテンツの品質劣化は予測不能で、複雑で、しばしば開始されるため、Wild動画のブラインド品質の予測は非常に難しい。
ここでは、主要なVQAモデルの包括的評価を行うことにより、この問題の進展に寄与する。
先行するVQAモデルの特徴の上に特徴選択戦略を適用することで,先行するモデルが使用する統計的特徴のうち60点を抽出することができる。
我々の実験結果から,VIDEVALは,他の先行モデルよりも計算コストがかなり低く,最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-05-29T00:39:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。