論文の概要: Predicting Oscar-Nominated Screenplays with Sentence Embeddings
- arxiv url: http://arxiv.org/abs/2511.05500v1
- Date: Mon, 29 Sep 2025 15:25:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.149376
- Title: Predicting Oscar-Nominated Screenplays with Sentence Embeddings
- Title(参考訳): 文体埋め込みによるオスカー指名脚本の予測
- Authors: Francis Gross,
- Abstract要約: 本研究は,現代言語モデルを用いて,脚本のオスカーノミネートを予測できるかどうかを考察する。
適切なデータセットが得られなかったため、MovieSumの映画脚本コレクションとキュレートされたオスカーレコードを組み合わせることで、Movie-O-Labelと呼ばれる新しいデータセットが作成された。
ベストパフォーマンスモデルはマクロF1スコア0.66、正確リコールAP0.445、ROC-AUC0.79に達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Oscar nominations are an important factor in the movie industry because they can boost both the visibility and the commercial success. This work explores whether it is possible to predict Oscar nominations for screenplays using modern language models. Since no suitable dataset was available, a new one called Movie-O-Label was created by combining the MovieSum collection of movie scripts with curated Oscar records. Each screenplay was represented by its title, Wikipedia summary, and full script. Long scripts were split into overlapping text chunks and encoded with the E5 sentence em bedding model. Then, the screenplay embed dings were classified using a logistic regression model. The best results were achieved when three feature inputs related to screenplays (script, summary, and title) were combined. The best-performing model reached a macro F1 score of 0.66, a precision recall AP of 0.445 with baseline 0.19 and a ROC-AUC of 0.79. The results suggest that even simple models based on modern text embeddings demonstrate good prediction performance and might be a starting point for future research.
- Abstract(参考訳): アカデミー賞のノミネートは、可視性と商業的成功の両方を高めることができるため、映画業界において重要な要素である。
本研究は,現代言語モデルを用いて,脚本のオスカーノミネートを予測できるかどうかを考察する。
適切なデータセットが得られなかったため、MovieSumの映画脚本コレクションとキュレートされたオスカーレコードを組み合わせることで、Movie-O-Labelと呼ばれる新しいデータセットが作成された。
それぞれの脚本はタイトル、ウィキペディアの要約、フルスクリプトで表現された。
長いスクリプトは重なり合うテキストチャンクに分割され、E5文の埋め込みモデルでエンコードされた。
次に,ロジスティック回帰モデルを用いて,画面埋め込み方式を分類した。
最高の結果は、スクリーンプレイに関連する3つの特徴入力(スクリプト、要約、タイトル)を組み合わせることで達成された。
最高性能モデルはマクロF1スコア0.66、高精度リコールAP0.445、ベースライン0.19、ROC-AUC0.79に到達した。
その結果,現代テキスト埋め込みに基づく単純なモデルであっても予測性能は良好であり,今後の研究の出発点となる可能性が示唆された。
関連論文リスト
- ScreenWriter: Automatic Screenplay Generation and Movie Summarisation [55.20132267309382]
ビデオコンテンツは、ユーザーがキープロットポイントをリコールしたり、見ずに概要を見ることができるようなテキスト記述や要約の需要を駆り立ててきた。
本稿では,映像のみを操作し,対話,話者名,シーンブレーク,視覚的記述を含む出力を生成するScreenWriterを提案する。
ScreenWriterは、映像を視覚ベクトルのシーケンスに基づいてシーンに分割する新しいアルゴリズムを導入し、アクターの顔のデータベースに基づく文字名決定の難しい問題に対する新しい方法を提案する。
論文 参考訳(メタデータ) (2024-10-17T07:59:54Z) - MovieSum: An Abstractive Summarization Dataset for Movie Screenplays [11.318175666743656]
映画脚本の抽象的な要約のための新しいデータセットであるMovieSumを提示する。
このデータセットはウィキペディアのプロットサマリーを伴って2200の映画脚本で構成されている。
論文 参考訳(メタデータ) (2024-08-12T16:43:09Z) - Movie101: A New Movie Understanding Benchmark [47.24519006577205]
大規模な中国の映画ベンチマーク「Movie101」を構築した。
映画ナレーション評価のためのMNScore(Movie Narration Score)と呼ばれる新しい指標を提案する。
両タスクにおいて,提案手法は外部知識をうまく活用し,慎重に設計したベースラインよりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-05-20T08:43:51Z) - EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained
Embedding Matching [90.98122161162644]
現在のビデオキャプションの指標は、主に参照キャプションと候補キャプションのテキストレベルの比較に基づいている。
EMScore(Embedding Matching-based score)を提案する。
我々は、よく訓練された視覚言語モデルを用いて、EMScore 計算のための視覚的および言語的埋め込みを抽出する。
論文 参考訳(メタデータ) (2021-11-17T06:02:43Z) - Screenplay Quality Assessment: Can We Predict Who Gets Nominated? [53.9153892362629]
本稿では,言語的手がかりに基づく脚本の品質評価手法を提案する。
産業の意見やナラトロジーに基づいて、ドメイン固有の特徴を共通分類技法に抽出し、統合する。
論文 参考訳(メタデータ) (2020-05-13T02:39:56Z) - Speech2Action: Cross-modal Supervision for Action Recognition [127.10071447772407]
BERTベースのSpeech2Action分類器を1000以上の映画画面上で訓練する。
次に,このモデルを大容量映画コーパスの音声セグメントに適用する。
このモデルの予測を用いて,800K以上のビデオクリップに対して弱い動作ラベルを求める。
論文 参考訳(メタデータ) (2020-03-30T16:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。