論文の概要: MovieSum: An Abstractive Summarization Dataset for Movie Screenplays
- arxiv url: http://arxiv.org/abs/2408.06281v1
- Date: Mon, 12 Aug 2024 16:43:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 13:03:23.737001
- Title: MovieSum: An Abstractive Summarization Dataset for Movie Screenplays
- Title(参考訳): MovieSum:映画脚本のための抽象的な要約データセット
- Authors: Rohit Saxena, Frank Keller,
- Abstract要約: 映画脚本の抽象的な要約のための新しいデータセットであるMovieSumを提示する。
このデータセットはウィキペディアのプロットサマリーを伴って2200の映画脚本で構成されている。
- 参考スコア(独自算出の注目度): 11.318175666743656
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Movie screenplay summarization is challenging, as it requires an understanding of long input contexts and various elements unique to movies. Large language models have shown significant advancements in document summarization, but they often struggle with processing long input contexts. Furthermore, while television transcripts have received attention in recent studies, movie screenplay summarization remains underexplored. To stimulate research in this area, we present a new dataset, MovieSum, for abstractive summarization of movie screenplays. This dataset comprises 2200 movie screenplays accompanied by their Wikipedia plot summaries. We manually formatted the movie screenplays to represent their structural elements. Compared to existing datasets, MovieSum possesses several distinctive features: (1) It includes movie screenplays, which are longer than scripts of TV episodes. (2) It is twice the size of previous movie screenplay datasets. (3) It provides metadata with IMDb IDs to facilitate access to additional external knowledge. We also show the results of recently released large language models applied to summarization on our dataset to provide a detailed baseline.
- Abstract(参考訳): 長い入力コンテキストと映画特有の様々な要素を理解する必要があるため、映画の脚本の要約は困難である。
大規模言語モデルは文書要約の大幅な進歩を示しているが、長い入力コンテキストの処理に苦慮することが多い。
また、近年はテレビの脚本も注目されているが、映画脚本の要約はいまだに未検討である。
そこで本研究では,映画画面の抽象的な要約のための新しいデータセットであるMovieSumを提案する。
このデータセットはウィキペディアのプロットサマリーを伴って2200の映画脚本で構成されている。
映画の脚本を手動で書式化し、それらの構成要素を表現した。
既存のデータセットと比較して、MovieSumにはいくつかの特徴がある。(1)テレビ番組の脚本よりも長い映画の脚本を含む。
2) 以前の上映データセットの2倍の大きさである。
(3)追加の外部知識へのアクセスを容易にするため、IMDb IDのメタデータを提供する。
また,最近リリースされた大規模言語モデルを用いてデータセットの要約を行い,詳細なベースラインを提供する。
関連論文リスト
- Movie101v2: Improved Movie Narration Benchmark [53.54176725112229]
大規模なバイリンガル映画ナレーションデータセットMovie101v2を開発した。
映画ナレーションの達成に欠かせない課題を考慮し、長期的な目標を3段階に分けた。
以上の結果から,映画ナレーション生成の達成は,徹底的な研究を必要とする魅力的な目標であることが示唆された。
論文 参考訳(メタデータ) (2024-04-20T13:15:27Z) - Select and Summarize: Scene Saliency for Movie Script Summarization [11.318175666743656]
そこで本研究では,100本の映画に対して,人間による注釈付きサリエントシーンからなるシーン・サリエンシ・データセットを提案する。
そこで本研究では,まずスクリプト中の健全なシーンを識別し,そのシーンのみを用いて要約を生成する2段階の抽象要約手法を提案する。
論文 参考訳(メタデータ) (2024-04-04T16:16:53Z) - Movie101: A New Movie Understanding Benchmark [47.24519006577205]
大規模な中国の映画ベンチマーク「Movie101」を構築した。
映画ナレーション評価のためのMNScore(Movie Narration Score)と呼ばれる新しい指標を提案する。
両タスクにおいて,提案手法は外部知識をうまく活用し,慎重に設計したベースラインよりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-05-20T08:43:51Z) - VideoXum: Cross-modal Visual and Textural Summarization of Videos [54.0985975755278]
我々は新しい共同ビデオとテキスト要約タスクを提案する。
目標は、短縮されたビデオクリップと、長いビデオから対応するテキスト要約の両方を生成することだ。
生成された短縮ビデオクリップとテキストナラティブは、セマンティックに適切に調整されるべきである。
論文 参考訳(メタデータ) (2023-03-21T17:51:23Z) - Movie Summarization via Sparse Graph Construction [65.16768855902268]
マルチモーダル情報を用いて構築された,シーン間の関係を表すスパースなムービーグラフを構築することで,TPシーンを識別するモデルを提案する。
人間の判断によれば、我々のアプローチによって作成された要約は、シーケンスベースモデルや汎用的な要約アルゴリズムの出力よりも、より情報的で完全であり、より高い評価を受けている。
論文 参考訳(メタデータ) (2020-12-14T13:54:34Z) - Screenplay Quality Assessment: Can We Predict Who Gets Nominated? [53.9153892362629]
本稿では,言語的手がかりに基づく脚本の品質評価手法を提案する。
産業の意見やナラトロジーに基づいて、ドメイン固有の特徴を共通分類技法に抽出し、統合する。
論文 参考訳(メタデータ) (2020-05-13T02:39:56Z) - Condensed Movies: Story Based Retrieval with Contextual Embeddings [83.73479493450009]
我々は3K映画の主要シーンからなるコンデンサド映画データセット(CMD)を作成する。
データセットはスケーラブルで、YouTubeから自動的に取得され、誰でもダウンロードして利用できる。
我々は、文字、音声、視覚的手がかりを1つのビデオ埋め込みに組み合わせ、データセット上でテキストからビデオまでを検索するためのディープネットワークベースラインを提供する。
論文 参考訳(メタデータ) (2020-05-08T17:55:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。