論文の概要: Can we predict the Most Replayed data of video streaming platforms?
- arxiv url: http://arxiv.org/abs/2309.06102v1
- Date: Tue, 12 Sep 2023 10:08:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:42:01.669491
- Title: Can we predict the Most Replayed data of video streaming platforms?
- Title(参考訳): ビデオストリーミングプラットフォームの最も再生されたデータを予測できますか?
- Authors: Alessandro Duico, Ombretta Strafforello, Jan van Gemert
- Abstract要約: YouTubeビデオから最も再生率の高い(MR)データを予測できるかどうかを検討する。
この目的のために、大規模なビデオベンチマークであるYTMR500データセットをキュレートする。
我々は、データセット上で様々な複雑さのディープラーニング(DL)モデルを評価し、広範囲にわたるアブレーション研究を行う。
- 参考スコア(独自算出の注目度): 57.55927378696826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting which specific parts of a video users will replay is important for
several applications, including targeted advertisement placement on video
platforms and assisting video creators. In this work, we explore whether it is
possible to predict the Most Replayed (MR) data from YouTube videos. To this
end, we curate a large video benchmark, the YTMR500 dataset, which comprises
500 YouTube videos with MR data annotations. We evaluate Deep Learning (DL)
models of varying complexity on our dataset and perform an extensive ablation
study. In addition, we conduct a user study to estimate the human performance
on MR data prediction. Our results show that, although by a narrow margin, all
the evaluated DL models outperform random predictions. Additionally, they
exceed human-level accuracy. This suggests that predicting the MR data is a
difficult task that can be enhanced through the assistance of DL. Finally, we
believe that DL performance on MR data prediction can be further improved, for
example, by using multi-modal learning. We encourage the research community to
use our benchmark dataset to further investigate automatic MR data prediction.
- Abstract(参考訳): ビデオプラットフォームのターゲット広告配置やビデオクリエーターの支援など、ビデオユーザの特定の部分の再生を予測することは、いくつかのアプリケーションにとって重要である。
本研究では,youtubeビデオから最も再生された(mr)データを予測できるかどうかについて検討する。
この目的のために,大規模なビデオベンチマークであるytmr500データセットをキュレートした。
データセット上の複雑性の異なるディープラーニング(dl)モデルを評価し,広範なアブレーション研究を行う。
また,mrデータ予測におけるヒューマンパフォーマンスを推定するために,ユーザ調査を行った。
その結果, 評価されたDLモデルは, 差が狭いものの, ランダムな予測よりも優れていることがわかった。
また、人間レベルの精度を超えている。
これは、mrデータの予測はdlの助けを借りて強化できる難しいタスクであることを示唆している。
最後に,MRデータ予測におけるDL性能は,例えばマルチモーダル学習を用いてさらに向上できると考えている。
ベンチマークデータセットを使用して、mrデータの自動予測をさらに調査することを研究コミュニティに推奨します。
関連論文リスト
- CinePile: A Long Video Question Answering Dataset and Benchmark [55.30860239555001]
我々は、CinePileという新しいデータセットとベンチマークを提示する。
包括的データセットは305,000の多重選択質問(MCQ)から構成されており、様々な視覚的・マルチモーダル的な側面をカバーしている。
トレーニングスプリットに関して、オープンソースのVideo-LLMを微調整し、データセットのテストスプリット上で、オープンソースとプロプライエタリなビデオ中心LLMの両方を評価しました。
論文 参考訳(メタデータ) (2024-05-14T17:59:02Z) - Prompt Public Large Language Models to Synthesize Data for Private On-device Applications [5.713077600587505]
本稿では,DP と FL でトレーニングしたデバイス上での言語モデルにおいて,公開データに基づいてトレーニングした大規模言語モデル (LLM) が事前学習データの質を向上する方法について検討する。
合成データセットに事前学習したモデルでは, 単語予測精度が19.0%, 22.8%向上した。
実験では, プライベートデータにアクセスしなくても, プライベートデータに近いデータを合成する上でのLCMの強みを実証した。
論文 参考訳(メタデータ) (2024-04-05T19:14:14Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Scaling Relationship on Learning Mathematical Reasoning with Large
Language Models [75.29595679428105]
本研究では,事前学習損失,教師付きデータ量,拡張データ量が教師付きLDMの推論性能に与える影響について検討する。
複数のモデルからの拒絶サンプルは、LLaMA-7BをGSM8Kの49.3%の精度に押し上げ、監督された微調整(SFT)の精度を35.9%上回る結果となった。
論文 参考訳(メタデータ) (2023-08-03T15:34:01Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - MRCLens: an MRC Dataset Bias Detection Toolkit [82.44296974850639]
MRCLensは,ユーザがフルモデルをトレーニングする前に,バイアスが存在するかどうかを検出するツールキットである。
ツールキットの導入の便宜のために,MDCにおける共通バイアスの分類も提供する。
論文 参考訳(メタデータ) (2022-07-18T21:05:39Z) - NoisyActions2M: A Multimedia Dataset for Video Understanding from Noisy
Labels [33.659146748289444]
約200万のビデオと関連するユーザ生成アノテーションやその他のメタ情報からなるベンチマークデータセットを作成します。
提案したデータセット上で事前トレーニングされたネットワークは、下流データセットにおけるビデオの破損やラベルノイズに対してどのように役立つかを示す。
論文 参考訳(メタデータ) (2021-10-13T16:12:18Z) - Self-Supervised Representation Learning for Detection of ACL Tear Injury
in Knee MR Videos [18.54362818156725]
本稿では,MRビデオクリップから伝達可能な特徴を学習するための自己教師付き学習手法を提案する。
我々の知る限りでは、MRビデオから損傷分類タスクを実行する教師付き学習モデルには、モデルによる決定についての説明がない。
論文 参考訳(メタデータ) (2020-07-15T15:35:47Z) - Constructing a Highlight Classifier with an Attention Based LSTM Neural
Network [0.0]
市場研究者は、関連する部分を特定するために、消費者調査ビデオの大部分を手作業でレビューする。
本研究では,教師付き学習モデルに基づくNLPに基づくハイライト識別と抽出のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-12T15:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。