Fugu-MT 論文翻訳(概要): MDS-VQA: Model-Informed Data Selection for Video Quality Assessment

論文の概要: MDS-VQA: Model-Informed Data Selection for Video Quality Assessment

arxiv url: http://arxiv.org/abs/2603.11525v1
Date: Thu, 12 Mar 2026 04:19:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-13 14:46:25.862253
Title: MDS-VQA: Model-Informed Data Selection for Video Quality Assessment
Title（参考訳）: MDS-VQA:ビデオ品質評価のためのモデルインフォームドデータ選択
Authors: Jian Zou, Xiaoyu Xu, Zhihua Wang, Yilin Wang, Balu Adsumilli, Kede Ma,
Abstract要約: MDS-VQAは、ラベルなし動画をキュレートするためのモデルインフォームドデータ選択機構である。難易度は、ランク付け目標で訓練された故障予測器によって推定され、多様性は深いセマンティックビデオ特徴を用いて測定される。複数のVQAデータセットとモデルにまたがる実験により、MDS-VQAは多様な、困難なサンプルを識別することを示した。
参考スコア（独自算出の注目度）: 39.416519746709305
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learning-based video quality assessment (VQA) has advanced rapidly, yet progress is increasingly constrained by a disconnect between model design and dataset curation. Model-centric approaches often iterate on fixed benchmarks, while data-centric efforts collect new human labels without systematically targeting the weaknesses of existing VQA models. Here, we describe MDS-VQA, a model-informed data selection mechanism for curating unlabeled videos that are both difficult for the base VQA model and diverse in content. Difficulty is estimated by a failure predictor trained with a ranking objective, and diversity is measured using deep semantic video features, with a greedy procedure balancing the two under a constrained labeling budget. Experiments across multiple VQA datasets and models demonstrate that MDS-VQA identifies diverse, challenging samples that are particularly informative for active fine-tuning. With only a 5% selected subset per target domain, the fine-tuned model improves mean SRCC from 0.651 to 0.722 and achieves the top gMAD rank, indicating strong adaptation and generalization.
Abstract（参考訳）: 学習に基づくビデオ品質評価(VQA)は急速に進歩しているが、モデル設計とデータセットキュレーションの切り離しによって進歩はますます制限されている。モデル中心のアプローチは、しばしば固定ベンチマークを繰り返すが、データ中心の取り組みは、既存のVQAモデルの弱点を体系的にターゲットすることなく、新しい人間のラベルを収集する。本稿では,基本VQAモデルでは困難であり,多種多様である未表示動画をキュレートするためのモデルインフォームドデータ選択機構であるMDS-VQAについて述べる。難易度は、ランク付け目標で訓練された故障予測器によって推定され、より深いセマンティックビデオ特徴を用いて多様性を計測し、制約付きラベル付け予算の下で両者のバランスをとる。複数のVQAデータセットとモデルにまたがる実験により、MDS-VQAは、特にアクティブな微調整に有用な、多種多様で挑戦的なサンプルを特定している。ターゲットドメイン毎に選択されたサブセットは5%に過ぎず、微調整されたモデルでは平均SRCCが0.651から0.722に改善され、高い適応と一般化を示す最高gMADランクが達成される。

論文の概要: MDS-VQA: Model-Informed Data Selection for Video Quality Assessment

関連論文リスト