論文の概要: STAGE: A Benchmark for Knowledge Graph Construction, Question Answering, and In-Script Role-Playing over Movie Screenplays
- arxiv url: http://arxiv.org/abs/2601.08510v1
- Date: Tue, 13 Jan 2026 12:50:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.199452
- Title: STAGE: A Benchmark for Knowledge Graph Construction, Question Answering, and In-Script Role-Playing over Movie Screenplays
- Title(参考訳): STAGE: 映画画面上での知識グラフ構築,質問回答,インスクリプトロールプレイングのためのベンチマーク
- Authors: Qiuyu Tian, Yiding Li, Fengyi Chen, Zequn Liu, Youyong Kong, Fan Guo, Yuyao Li, Jinjing Shen, Zhijing Xie, Yiyun Luo, Xin Zhang,
- Abstract要約: 本稿では,フル長の映画画面上での物語理解のためのベンチマークであるSTAGE(Screenplay Text, Agents, Graphs and Evaluation)を紹介する。
STAGEは、ナレッジグラフの構成、シーンレベルのイベント要約、長文のスクリーンプレイ質問応答、インスクリプトのキャラクターロールプレイングの4つのタスクを、すべて共有された物語の世界表現に基づいて定義している。
このベンチマークは、クリーン化されたスクリプト、キュレートされた知識グラフ、および英語と中国語の150本の映画に対するイベント中心および文字中心のアノテーションを提供し、世界表現の構築、物語の抽象化と検証、長い物語の推論、そして生成を可能にする。
- 参考スコア(独自算出の注目度): 16.069095458601588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Movie screenplays are rich long-form narratives that interleave complex character relationships, temporally ordered events, and dialogue-driven interactions. While prior benchmarks target individual subtasks such as question answering or dialogue generation, they rarely evaluate whether models can construct a coherent story world and use it consistently across multiple forms of reasoning and generation. We introduce STAGE (Screenplay Text, Agents, Graphs and Evaluation), a unified benchmark for narrative understanding over full-length movie screenplays. STAGE defines four tasks: knowledge graph construction, scene-level event summarization, long-context screenplay question answering, and in-script character role-playing, all grounded in a shared narrative world representation. The benchmark provides cleaned scripts, curated knowledge graphs, and event- and character-centric annotations for 150 films across English and Chinese, enabling holistic evaluation of models' abilities to build world representations, abstract and verify narrative events, reason over long narratives, and generate character-consistent responses.
- Abstract(参考訳): 映画の脚本は、複雑なキャラクター関係、時間順のイベント、対話駆動の相互作用をインターリーブするリッチな長文の物語である。
従来のベンチマークでは、質問応答や対話生成などの個別のサブタスクを対象としていたが、モデルが一貫性のあるストーリーワールドを構築し、複数の推論と生成の形式で一貫して使用できるかどうかを評価することは滅多にない。
本稿では,フル長の映画画面上での物語理解のためのベンチマークであるSTAGE(Screenplay Text, Agents, Graphs and Evaluation)を紹介する。
STAGEは、ナレッジグラフの構成、シーンレベルのイベント要約、長文のスクリーンプレイ質問応答、インスクリプトのキャラクターロールプレイングの4つのタスクを、すべて共有された物語の世界表現に基づいて定義している。
このベンチマークでは、英語と中国語の150本の映画に対して、クリーンなスクリプト、キュレートされた知識グラフ、およびイベント中心および文字中心のアノテーションを提供し、世界表現の構築、物語の抽象化と検証、長い物語の推論、文字一貫性のある応答の生成を可能にする。
関連論文リスト
- ViStoryBench: Comprehensive Benchmark Suite for Story Visualization [23.274981415638837]
ViStoryBenchは、さまざまな物語構造、視覚スタイル、キャラクター設定にわたるストーリービジュアライゼーションモデルを評価するために設計された包括的なベンチマークである。
ベンチマークでは、文学、映画、民俗学にまたがるキュレートされたストーリーから派生した、豊富な注釈付きマルチショットスクリプトが特徴である。
徹底的な評価を可能にするために、ViStoryBenchは、文字の一貫性、スタイルの類似性、迅速な順守、美的品質、生成アーティファクトを評価する一連の自動メトリクスを導入した。
論文 参考訳(メタデータ) (2025-05-30T17:58:21Z) - DiscoGraMS: Enhancing Movie Screen-Play Summarization using Movie Character-Aware Discourse Graph [6.980991481207376]
映画脚本を映画キャラクタ対応の談話グラフ(CaD Graph)として表現する新しいリソースであるDiscoGraMSを紹介する。
このモデルは、スクリーンプレイの内容をより包括的で忠実に表現することで、すべての健全な情報を保存することを目的としている。
論文 参考訳(メタデータ) (2024-10-18T17:56:11Z) - ScreenWriter: Automatic Screenplay Generation and Movie Summarisation [55.20132267309382]
ビデオコンテンツは、ユーザーがキープロットポイントをリコールしたり、見ずに概要を見ることができるようなテキスト記述や要約の需要を駆り立ててきた。
本稿では,映像のみを操作し,対話,話者名,シーンブレーク,視覚的記述を含む出力を生成するScreenWriterを提案する。
ScreenWriterは、映像を視覚ベクトルのシーケンスに基づいてシーンに分割する新しいアルゴリズムを導入し、アクターの顔のデータベースに基づく文字名決定の難しい問題に対する新しい方法を提案する。
論文 参考訳(メタデータ) (2024-10-17T07:59:54Z) - Agents' Room: Narrative Generation through Multi-step Collaboration [54.98886593802834]
本稿では,物語の執筆を特殊エージェントが取り組んだサブタスクに分解する,物語理論に触発された世代フレームワークを提案する。
エージェントの部屋は,専門的評価者が好むストーリーをベースラインシステムより生成することを示す。
論文 参考訳(メタデータ) (2024-10-03T15:44:42Z) - Generating Visual Stories with Grounded and Coreferent Characters [63.07511918366848]
本稿では,一貫した接地的・中核的な特徴を持つ視覚的ストーリーを予測できる最初のモデルを提案する。
我々のモデルは、広く使われているVISTベンチマークの上に構築された新しいデータセットに基づいて微調整されています。
また、物語における文字の豊かさとコア参照を測定するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2024-09-20T14:56:33Z) - Select and Summarize: Scene Saliency for Movie Script Summarization [11.318175666743656]
そこで本研究では,100本の映画に対して,人間による注釈付きサリエントシーンからなるシーン・サリエンシ・データセットを提案する。
そこで本研究では,まずスクリプト中の健全なシーンを識別し,そのシーンのみを用いて要約を生成する2段階の抽象要約手法を提案する。
論文 参考訳(メタデータ) (2024-04-04T16:16:53Z) - Movie Summarization via Sparse Graph Construction [65.16768855902268]
マルチモーダル情報を用いて構築された,シーン間の関係を表すスパースなムービーグラフを構築することで,TPシーンを識別するモデルを提案する。
人間の判断によれば、我々のアプローチによって作成された要約は、シーケンスベースモデルや汎用的な要約アルゴリズムの出力よりも、より情報的で完全であり、より高い評価を受けている。
論文 参考訳(メタデータ) (2020-12-14T13:54:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。