論文の概要: LEHA-CVQAD: Dataset To Enable Generalized Video Quality Assessment of Compression Artifacts
- arxiv url: http://arxiv.org/abs/2507.03990v1
- Date: Sat, 05 Jul 2025 10:41:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.961354
- Title: LEHA-CVQAD: Dataset To Enable Generalized Video Quality Assessment of Compression Artifacts
- Title(参考訳): LEHA-CVQAD:圧縮アーチファクトの一般的なビデオ品質評価を可能にするデータセット
- Authors: Aleksandr Gushchin, Maksim Smirnov, Dmitriy Vatolin, Anastasia Antsiferova,
- Abstract要約: 圧縮指向ビデオ品質評価のための6,240クリップからなるLEHA-CVQADデータセットを提案する。
59のソースビデオは186のプリセット版と1.8Mのペアでエンコードされ、1.5kのMOS評価は単一の品質尺度に融合される。
また、VQAモデルがいかに高品質な注文を保ったかを定量化する新しい評価指標RDAEを提案する。
- 参考スコア(独自算出の注目度): 44.95552843771737
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose the LEHA-CVQAD (Large-scale Enriched Human-Annotated) dataset, which comprises 6,240 clips for compression-oriented video quality assessment. 59 source videos are encoded with 186 codec-preset variants, 1.8M pairwise, and 1.5k MOS ratings are fused into a single quality scale; part of the videos remains hidden for blind evaluation. We also propose Rate-Distortion Alignment Error (RDAE), a novel evaluation metric that quantifies how well VQA models preserve bitrate-quality ordering, directly supporting codec parameter tuning. Testing IQA/VQA methods reveals that popular VQA metrics exhibit high RDAE and lower correlations, underscoring the dataset challenges and utility. The open part and the results of LEHA-CVQAD are available at https://aleksandrgushchin.github$.io/lcvqad/
- Abstract(参考訳): 圧縮指向ビデオ品質評価のための6,240クリップからなるLEHA-CVQADデータセットを提案する。
59のソースビデオは186のコーデックプリセットでエンコードされ、1.8Mのペアで、1.5kのMOS評価は単一の品質尺度に融合している。
また、VQAモデルがビットレート品質の順序付けをいかによく維持するかを定量化し、コーデックパラメータチューニングを直接サポートする新しい評価指標RDAEを提案する。
IQA/VQAメソッドをテストすると、人気のあるVQAメトリクスがRDAEと低い相関を示し、データセットの課題とユーティリティを裏付けることが明らかになった。
オープン部分とLEHA-CVQADの結果はhttps://aleksandrgushchin.github$.comで公開されている。
io/lcvqad/
関連論文リスト
- EVQAScore: A Fine-grained Metric for Video Question Answering Data Quality Evaluation [21.797332686137203]
本稿では,ビデオキャプションとビデオQAデータ品質の両方を評価するためにキーワード抽出を利用する参照フリー手法EVQAScoreを紹介する。
提案手法は,Kendall相関32.8,Spearman相関42.3,従来のPAC-S++よりも4.7,5.9,動画キャプション評価5.9)。
データ選択にEVQAScoreを用いることで、元のデータボリュームのわずか12.5%でSOTA結果を達成し、以前のSOTA手法であるPAC-Sと100%のデータより優れていた。
論文 参考訳(メタデータ) (2024-11-11T12:11:36Z) - AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results [120.95863275142727]
本稿では,ECCV 2024における画像操作の進歩(AIM)ワークショップと共同で開催されている圧縮映像品質評価の課題について述べる。
この課題は、様々な圧縮標準の14コーデックで符号化された459本の動画の多様なデータセット上で、VQA法の性能を評価することであった。
論文 参考訳(メタデータ) (2024-08-21T20:32:45Z) - Full Reference Video Quality Assessment for Machine Learning-Based Video
Codecs [12.024300171633758]
DSPをベースとしたビデオコーデックを設計・訓練した既存の評価指標は,MLビデオコーデックを用いた場合の主観的評価と強く相関しないことを示す。
モデルレベルではピアソン相関係数0.99、スピアマンランク相関係数0.99を達成する新しいフルリファレンスビデオ品質評価(FRVQA)モデルを提案する。
論文 参考訳(メタデータ) (2023-09-02T00:32:26Z) - Video compression dataset and benchmark of learning-based video-quality
metrics [55.41644538483948]
本稿では,ビデオ圧縮の評価を行うビデオ品質指標の新しいベンチマークを提案する。
これは、異なる標準でエンコードされた約2,500のストリームからなる、新しいデータセットに基づいている。
クラウドソーシングによるペアワイズ比較により,主観的スコアを収集した。
論文 参考訳(メタデータ) (2022-11-22T09:22:28Z) - UGC-VQA: Benchmarking Blind Video Quality Assessment for User Generated
Content [59.13821614689478]
コンテンツの品質劣化は予測不能で、複雑で、しばしば開始されるため、Wild動画のブラインド品質の予測は非常に難しい。
ここでは、主要なVQAモデルの包括的評価を行うことにより、この問題の進展に寄与する。
先行するVQAモデルの特徴の上に特徴選択戦略を適用することで,先行するモデルが使用する統計的特徴のうち60点を抽出することができる。
我々の実験結果から,VIDEVALは,他の先行モデルよりも計算コストがかなり低く,最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-05-29T00:39:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。