論文の概要: Screenplay Summarization Using Latent Narrative Structure
- arxiv url: http://arxiv.org/abs/2004.12727v1
- Date: Mon, 27 Apr 2020 11:54:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:22:01.025078
- Title: Screenplay Summarization Using Latent Narrative Structure
- Title(参考訳): ラテントナラティブ構造を用いた画面要約
- Authors: Pinelopi Papalampidi, Frank Keller, Lea Frermann, Mirella Lapata
- Abstract要約: 本稿では,物語の基盤となる構造を一般教師なし・教師付き抽出要約モデルに明示的に組み込むことを提案する。
重要な物語イベント(転回点)の観点で物語構造を定式化し、脚本を要約するために潜伏状態として扱う。
シーンレベルの要約ラベルを付加したテレビ画面のCSIコーパスの実験結果から,潜角点がCSIエピソードの重要な側面と相関していることが判明した。
- 参考スコア(独自算出の注目度): 78.45316339164133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most general-purpose extractive summarization models are trained on news
articles, which are short and present all important information upfront. As a
result, such models are biased on position and often perform a smart selection
of sentences from the beginning of the document. When summarizing long
narratives, which have complex structure and present information piecemeal,
simple position heuristics are not sufficient. In this paper, we propose to
explicitly incorporate the underlying structure of narratives into general
unsupervised and supervised extractive summarization models. We formalize
narrative structure in terms of key narrative events (turning points) and treat
it as latent in order to summarize screenplays (i.e., extract an optimal
sequence of scenes). Experimental results on the CSI corpus of TV screenplays,
which we augment with scene-level summarization labels, show that latent
turning points correlate with important aspects of a CSI episode and improve
summarization performance over general extractive algorithms leading to more
complete and diverse summaries.
- Abstract(参考訳): ほとんどの汎用的抽出要約モデルは、ニュース記事に基づいて訓練され、すべての重要な情報を事前に提示する。
結果として、このようなモデルは位置に偏りがあり、文書の冒頭から文章をスマートに選択することが多い。
複雑な構造を持ち情報断片的な長い物語を要約する場合、単純な位置ヒューリスティックは不十分である。
本稿では,物語の基本構造を一般に教師なしかつ教師なしの抽出要約モデルに明示的に組み込むことを提案する。
本研究では,重要な物語イベント(転向点)の観点で物語構造を定式化し,脚本(シーンの最適配列を抽出する)を要約するために潜時として扱う。
シーンレベルの要約ラベルを付加したcsiコーパスを用いた実験結果から,潜在ターニングポイントがcsiエピソードの重要な側面と相関し,汎用抽出アルゴリズムに対する要約性能が向上し,より完全かつ多様な要約が得られた。
関連論文リスト
- Evaluating the Ability of Computationally Extracted Narrative Maps to Encode Media Framing [1.2277343096128712]
本稿では、特定の物語抽出と表現アプローチ(物語マップ)の能力について考察する。
本結果は,ニュース物語における複雑なフレーミングのダイナミクスをユーザに提供するナラティブマップの可能性を強調した。
しかし、計算的物語抽出プロセスにおいて、フレーミング情報を直接活用することは、未解決の課題である。
論文 参考訳(メタデータ) (2024-05-04T14:40:28Z) - A Modular Approach for Multimodal Summarization of TV Shows [55.20132267309382]
分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文 参考訳(メタデータ) (2024-03-06T16:10:01Z) - NarraSum: A Large-Scale Dataset for Abstractive Narrative Summarization [26.80378373420446]
NarraSumは大規模な物語要約データセットである。
これには122Kの物語文書が含まれており、様々なジャンルの映画やテレビドラマのプロット記述や、それに対応する抽象的な要約から集められている。
実験の結果,NarraSumにおける人間と最先端の要約モデルの間には大きなパフォーマンスギャップがあることが判明した。
論文 参考訳(メタデータ) (2022-12-02T22:51:51Z) - Topic-Aware Encoding for Extractive Summarization [15.113768658584979]
この問題に対処するために,文書要約のためのトピック認識符号化を提案する。
ニューラルネットワークに基づく文レベルの表現学習にニューラルトピックモデルを追加し、中心トピック情報を適切に検討する。
3つの公開データセットの実験結果は、我々のモデルが最先端のモデルより優れていることを示している。
論文 参考訳(メタデータ) (2021-12-17T15:26:37Z) - SummScreen: A Dataset for Abstractive Screenplay Summarization [52.56760815805357]
SummScreenは、テレビシリーズトランスクリプトと人間の書かれたリキャップのペアで構成されたデータセットです。
プロットの詳細はしばしば文字対話で間接的に表現され、書き起こしの全体にわたって散らばることがある。
キャラクタはテレビシリーズの基本であるため,2つのエンティティ中心評価指標も提案する。
論文 参考訳(メタデータ) (2021-04-14T19:37:40Z) - Movie Summarization via Sparse Graph Construction [65.16768855902268]
マルチモーダル情報を用いて構築された,シーン間の関係を表すスパースなムービーグラフを構築することで,TPシーンを識別するモデルを提案する。
人間の判断によれば、我々のアプローチによって作成された要約は、シーケンスベースモデルや汎用的な要約アルゴリズムの出力よりも、より情報的で完全であり、より高い評価を受けている。
論文 参考訳(メタデータ) (2020-12-14T13:54:34Z) - Better Highlighting: Creating Sub-Sentence Summary Highlights [40.46639471959677]
本稿では,混乱を避けるために,自己完結型ハイライトを生成する新しい手法を提案する。
提案手法は, 決定点過程と文脈表現を組み合わせ, 部分文セグメントの最適集合を同定する。
本手法の柔軟性とモデリング能力を示すため,要約データセットに関する広範な実験を行った。
論文 参考訳(メタデータ) (2020-10-20T18:57:42Z) - Summarize, Outline, and Elaborate: Long-Text Generation via Hierarchical
Supervision from Extractive Summaries [46.183289748907804]
長文生成のためのアウトライン化,アウトライン化,エラボレートを行うパイプラインシステムSOEを提案する。
SOEは、より高速な収束速度とともに、非常に優れた品質の長いテキストを生成する。
論文 参考訳(メタデータ) (2020-10-14T13:22:20Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - The Shmoop Corpus: A Dataset of Stories with Loosely Aligned Summaries [72.48439126769627]
個々の章ごとに詳細なマルチパラグラフの要約と組み合わせた231ストーリーのデータセットであるShmoop Corpusを紹介します。
コーパスから、クローズ形式の質問応答や抽象的要約の簡易な形式を含む共通のNLPタスクのセットを構築する。
このコーパスのユニークな構造は、マシンストーリーの理解をより親しみやすいものにするための重要な基盤となると信じている。
論文 参考訳(メタデータ) (2019-12-30T21:03:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。