論文の概要: Ensuring Reliable Participation in Subjective Video Quality Tests Across Platforms
- arxiv url: http://arxiv.org/abs/2509.20001v1
- Date: Wed, 24 Sep 2025 11:17:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.789371
- Title: Ensuring Reliable Participation in Subjective Video Quality Tests Across Platforms
- Title(参考訳): プラットフォーム間の主観的映像品質テストにおける信頼性の高い参加の確保
- Authors: Babak Naderi, Ross Cutler,
- Abstract要約: ビデオ品質アセスメント(VQA)は、コミュニケーション、ストリーミング、パイプライン間のエンドユーザエクスペリエンスを測定するための金の標準である。
クラウドソーシングは正確で信頼性が高く、より速く、より安価な評価を提供するが、指示やゲーム報酬を無視した労働者による信頼できない提出に苦しむ。
最近のテストでは、ビデオメタデータの高度な活用とリモートデスクトップ接続の利用の増加が明らかにされている。
本稿では,RDユーザを対象とした主観的および主観的検出手法を提案し,その感受性と緩和性について2つの主流クラウドソーシングプラットフォームを比較した。
- 参考スコア(独自算出の注目度): 19.742094573993132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Subjective video quality assessment (VQA) is the gold standard for measuring end-user experience across communication, streaming, and UGC pipelines. Beyond high-validity lab studies, crowdsourcing offers accurate, reliable, faster, and cheaper evaluation-but suffers from unreliable submissions by workers who ignore instructions or game rewards. Recent tests reveal sophisticated exploits of video metadata and rising use of remote-desktop (RD) connections, both of which bias results. We propose objective and subjective detectors for RD users and compare two mainstream crowdsourcing platforms on their susceptibility and mitigation under realistic test conditions and task designs.
- Abstract(参考訳): 主観的ビデオ品質評価(VQA)は、コミュニケーション、ストリーミング、UGCパイプライン間のエンドユーザエクスペリエンスを測定するための金の標準である。
クラウドソーシングは精度が高く、信頼性が高く、より速く、より安価な評価を提供するが、指示やゲーム報酬を無視した労働者による信頼できない提出に苦しむ。
最近のテストでは、ビデオメタデータの高度な活用とリモートデスクトップ(RD)接続の利用の増加が示されており、どちらもバイアスが生じる。
本研究では,RDユーザを対象とした主観的および主観的検知器を提案し,現実的なテスト条件とタスク設計の下での受容性と緩和性について,2つの主流クラウドソーシングプラットフォームを比較した。
関連論文リスト
- Detecting Multimodal Situations with Insufficient Context and Abstaining from Baseless Predictions [75.45274978665684]
VLU(Vision-Language Understanding)ベンチマークには、提供されたコンテキストによってサポートされない仮定に答えが依存するサンプルが含まれている。
サンプル毎にコンテキストデータを収集し,エビデンスに基づくモデル予測を促進するためにコンテキスト選択モジュールをトレーニングする。
我々は,十分なコンテキストを欠いたサンプルを同定し,モデル精度を向上させる汎用なコンテキスト・アワレ認識検出器を開発した。
論文 参考訳(メタデータ) (2024-05-18T02:21:32Z) - Take Care of Your Prompt Bias! Investigating and Mitigating Prompt Bias in Factual Knowledge Extraction [56.17020601803071]
近年の研究では、事前学習言語モデル(PLM)が、事実知識抽出において「急激なバイアス」に悩まされていることが示されている。
本稿では,突発バイアスを徹底的に調査し緩和することにより,既存のベンチマークの信頼性を向上させることを目的とする。
論文 参考訳(メタデータ) (2024-03-15T02:04:35Z) - Towards Faithful and Robust LLM Specialists for Evidence-Based Question-Answering [10.624293689624151]
我々は、ソースの品質向上と属性応答性向上のために、LLM(Large Language Models)を頑健に微調整する方法について検討する。
具体的には、自動データ品質フィルタを備えたデータ生成パイプラインを導入し、多様な高品質なトレーニングおよびテストデータを大規模に合成する。
総合評価の結果, 合成データの微調整により, 内分布と外分布の両方の性能が向上することがわかった。
論文 参考訳(メタデータ) (2024-02-13T08:12:48Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Introspective Distillation for Robust Question Answering [70.18644911309468]
質問応答(QA)モデルは、例えば、視覚的QAに先行する言語や、読解における位置バイアスなど、データのバイアスを利用するためによく知られている。
近年の脱バイアス法は, 分配内(ID)性能のかなりの犠牲を伴い, 分配外(OOD)の一般化性を良好に達成している。
IntroD(Introspective Distillation)と呼ばれる新しい脱湿法を提案し,両者のQAを最大限に活用する。
論文 参考訳(メタデータ) (2021-11-01T15:30:15Z) - The INTERSPEECH 2020 Deep Noise Suppression Challenge: Datasets,
Subjective Testing Framework, and Challenge Results [27.074806625047646]
DNS Challengeは、リアルタイム単一チャンネル音声強調における協調研究を促進することを目的としている。
我々は,ノイズ抑圧モデルの学習のための大規模クリーン音声コーパスとノイズコーパスをオープンソース化した。
また、ITU-T P.808をベースとしたオンライン主観的テストフレームワークをオープンソースとして公開し、研究者が開発を確実に行えるようにした。
論文 参考訳(メタデータ) (2020-05-16T23:48:37Z) - The INTERSPEECH 2020 Deep Noise Suppression Challenge: Datasets,
Subjective Speech Quality and Testing Framework [27.074806625047646]
InterSPEECH 2020 Deep Noise Suppression Challengeは、リアルタイム単一チャネル音声強調における協調研究を促進することを目的としている。
我々は,騒音抑制モデルを訓練するための大規模なクリーン音声とノイズコーパスをオープンソースとして公開し,実世界のシナリオに対する代表的テストセットを作成した。
この挑戦の勝者は、P.808フレームワークを使用した代表的テストセットの主観的評価に基づいて選ばれる。
論文 参考訳(メタデータ) (2020-01-23T17:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。