論文の概要: Predicting IMDb Rating of TV Series with Deep Learning: The Case of
Arrow
- arxiv url: http://arxiv.org/abs/2208.13302v1
- Date: Sun, 28 Aug 2022 22:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 14:49:25.684551
- Title: Predicting IMDb Rating of TV Series with Deep Learning: The Case of
Arrow
- Title(参考訳): 深層学習によるテレビシリーズのimdb評価の予測--矢印の場合
- Authors: Anna Luiza Gomes, Get\'ulio Vianna, Tatiana Escovedo, Marcos
Kalinowski
- Abstract要約: 我々は,CW Network が放送するシリーズ Arrow の事例について検討し,IMDb 評価の予測に記述的および予測的モデリング手法を用いた。
許容根平均2乗誤差0.55でIMDb評価を予測できた。
- 参考スコア(独自算出の注目度): 1.3406258114080236
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context: The number of TV series offered nowadays is very high. Due to its
large amount, many series are canceled due to a lack of originality that
generates a low audience.
Problem: Having a decision support system that can show why some shows are a
huge success or not would facilitate the choices of renewing or starting a
show.
Solution: We studied the case of the series Arrow broadcasted by CW Network
and used descriptive and predictive modeling techniques to predict the IMDb
rating. We assumed that the theme of the episode would affect its evaluation by
users, so the dataset is composed only by the director of the episode, the
number of reviews that episode got, the percentual of each theme extracted by
the Latent Dirichlet Allocation (LDA) model of an episode, the number of
viewers from Wikipedia and the rating from IMDb. The LDA model is a generative
probabilistic model of a collection of documents made up of words.
Method: In this prescriptive research, the case study method was used, and
its results were analyzed using a quantitative approach.
Summary of Results: With the features of each episode, the model that
performed the best to predict the rating was Catboost due to a similar mean
squared error of the KNN model but a better standard deviation during the test
phase. It was possible to predict IMDb ratings with an acceptable root mean
squared error of 0.55.
- Abstract(参考訳): コンテクスト:今日提供されるテレビシリーズは、非常に多い。
大量生産のため、低視聴率のオリジナル性が欠如しているため、多くのシリーズがキャンセルされる。
問題: 何らかのショーが大きな成功を収めた理由を示すことができる意思決定支援システムを持つことで、ショーの更新や開始の選択が容易になる。
解決策: CW Network が放送した Arrow シリーズの事例を調査し,IMDb 評価の予測に記述的および予測的モデリング手法を用いた。
我々は,エピソードのテーマがユーザによる評価に影響を与えると仮定し,データセットはエピソードのディレクターによってのみ構成され,そのレビューの回数,エピソードのラテント・ディリクレ・アロケーション(LDA)モデルによって抽出された各テーマのパーセンテージ,ウィキペディアからの視聴者数,IMDbからのレーティングによって構成される。
LDAモデルは、単語からなる文書の集合の生成確率モデルである。
方法: 本研究では, ケーススタディ法を用い, 定量的手法を用いて解析した。
結果】各エピソードの特徴は,KNNモデルに類似した平均二乗誤差があるが,テスト期間中の標準偏差が良くなるため,評価を最善に予測したモデルはCataboostであった。
許容根平均二乗誤差0.55でimdbの評価を予測できた。
関連論文リスト
- Quantifying Bias in Text-to-Image Generative Models [49.60774626839712]
テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスは不公平な社会的表現を伝播させ、アイデアを積極的にマーケティングしたり、議論の的となっている議題を推進したりするのに用いられる。
既存のT2Iモデルバイアス評価手法は、社会的バイアスのみに焦点を当てる。
本稿では,T2I生成モデルにおける一般バイアスの定量化手法を提案する。
論文 参考訳(メタデータ) (2023-12-20T14:26:54Z) - Are Ensembles Getting Better all the Time? [24.442955229765957]
アンサンブルが常に改善されていることは、考慮された損失関数が凸である場合に限る。
医用予測(ニューラルネットを用いたメラノーマ診断)と「魔法の群集」実験(今後の映画の評価)について概説する。
論文 参考訳(メタデータ) (2023-11-29T18:32:37Z) - Towards Debiasing Frame Length Bias in Text-Video Retrieval via Causal
Intervention [72.12974259966592]
トリミングビデオクリップのトレーニングセットとテストセットのフレーム長差による時間偏差について,一意かつ体系的に検討した。
Epic-Kitchens-100, YouCook2, MSR-VTTデータセットについて, 因果脱バイアス法を提案し, 広範な実験およびアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-09-17T15:58:27Z) - Evaluating Graph Neural Networks for Link Prediction: Current Pitfalls
and New Benchmarking [66.83273589348758]
リンク予測は、グラフのエッジの一部のみに基づいて、目に見えないエッジが存在するかどうかを予測しようとする。
近年,この課題にグラフニューラルネットワーク(GNN)を活用すべく,一連の手法が導入されている。
これらの新しいモデルの有効性をよりよく評価するために、新しい多様なデータセットも作成されている。
論文 参考訳(メタデータ) (2023-06-18T01:58:59Z) - Spuriosity Rankings: Sorting Data to Measure and Mitigate Biases [62.54519787811138]
本稿では,突発的手がかりに依存したモデルバイアスを簡易かつ効果的に測定・緩和する手法を提案する。
我々は,解釈可能なネットワークの深部神経的特徴をベースとして,それらのクラス内の画像のランク付けを行う。
以上の結果から,素早い特徴依存によるモデルバイアスは,モデルがどのようにトレーニングされたかよりも,モデルがトレーニングされていることの影響がはるかに大きいことが示唆された。
論文 参考訳(メタデータ) (2022-12-05T23:15:43Z) - From None to Severe: Predicting Severity in Movie Scripts [10.536898728548838]
まず, 性, 暴力, 嫌悪感, 物質消費, 恐怖の5つの側面から, 映画の日常的重大度を分類する。
この問題は、予測の解釈性を同時に改善するシアムネットワークベースのマルチタスクフレームワークを用いて処理される。
論文 参考訳(メタデータ) (2021-09-20T03:01:46Z) - SummScreen: A Dataset for Abstractive Screenplay Summarization [52.56760815805357]
SummScreenは、テレビシリーズトランスクリプトと人間の書かれたリキャップのペアで構成されたデータセットです。
プロットの詳細はしばしば文字対話で間接的に表現され、書き起こしの全体にわたって散らばることがある。
キャラクタはテレビシリーズの基本であるため,2つのエンティティ中心評価指標も提案する。
論文 参考訳(メタデータ) (2021-04-14T19:37:40Z) - Automatic Face Understanding: Recognizing Families in Photos [6.131589026706621]
親族認識のための最大のデータベースを構築します。
ビデオダイナミックス、オーディオ、テキストキャプションは、親族認識システムの意思決定に使用することができる。
論文 参考訳(メタデータ) (2021-01-10T22:37:25Z) - Analyzing movies to predict their commercial viability for producers [0.0]
我々は、今後のフィルムのリターンを予測できるモデルを開発する。
このモデルの将来的な応用は、映画業界で見られ、プロダクション企業は彼らのプロジェクトの期待するリターンをより正確に予測できる。
論文 参考訳(メタデータ) (2021-01-05T18:42:38Z) - IMDb data from Two Generations, from 1979 to 2019; Part one, Dataset
Introduction and Preliminary Analysis [0.0]
ユーザ規制の「IMDb」と最も注目されているポータルは、巨大なデータベースを作成する機会を提供している。
評価データ、ジャンル、キャスト・アンド・クルー、MPAA格付け証明書、親子ガイドの詳細、関連映画情報、ポスター等、IMDbに提供される様々な情報で構成されており、これは現在までに最大のデータセットである79kタイトルである。
論文 参考訳(メタデータ) (2020-05-28T17:01:06Z) - How do Decisions Emerge across Layers in Neural Models? Interpretation
with Differentiable Masking [70.92463223410225]
DiffMaskは、差分性を維持しながら入力のサブセットをマスクアウトすることを学ぶ。
入力トークンを包含または無視する決定は、中間隠蔽層に基づく単純なモデルで行われる。
これにより、属性のヒートマップをプロットするだけでなく、ネットワーク層間で意思決定がどのように形成されるかを分析することができます。
論文 参考訳(メタデータ) (2020-04-30T17:36:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。