論文の概要: Analyzing Film Adaptation through Narrative Alignment
- arxiv url: http://arxiv.org/abs/2311.04020v1
- Date: Tue, 7 Nov 2023 14:18:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 15:08:50.305308
- Title: Analyzing Film Adaptation through Narrative Alignment
- Title(参考訳): ナラティブアライメントによる映画適応分析
- Authors: Tanzir Pial, Shahreen Salim, Charuta Pethe, Allen Kim, Steven Skiena
- Abstract要約: 小説は映画化されることが多いが、2つのメディアの違いは、通常、映画の脚本から原文を落とさなければならない。
そこで本研究では,Smith-Waterman局所アライメントアルゴリズムとSBERT埋め込み距離を用いて物語アライメントを構築し,シーンとブックユニット間のテキスト類似性を定量化する。
これらのアライメントを用いて40のアライメントの自動解析を行い, (i) 適応の忠実度, (ii) 対話の重要性, (iii) 物語の順序, (iv) ベクデル検定を反映したジェンダー表現問題に関して, (i) 適応の忠実度, (ii) ダイアログの重要性, および (iv) ベクデル検定を反映したジェンダー表現問題に関する洞察を明らかにする。
- 参考スコア(独自算出の注目度): 11.304581370821756
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Novels are often adapted into feature films, but the differences between the
two media usually require dropping sections of the source text from the movie
script. Here we study this screen adaptation process by constructing narrative
alignments using the Smith-Waterman local alignment algorithm coupled with
SBERT embedding distance to quantify text similarity between scenes and book
units. We use these alignments to perform an automated analysis of 40
adaptations, revealing insights into the screenwriting process concerning (i)
faithfulness of adaptation, (ii) importance of dialog, (iii) preservation of
narrative order, and (iv) gender representation issues reflective of the
Bechdel test.
- Abstract(参考訳): 小説はしばしば長編映画に脚色されるが、2つのメディアの違いは、通常、映画脚本からソーステキストのセクションを落とさなければならない。
そこで本研究では,Smith-Waterman局所アライメントアルゴリズムとSBERT埋め込み距離を組み合わせることで,シーンとブックユニット間のテキスト類似性を定量化する。
これらのアライメントを使用して40の適応を自動解析し、スクリーンライティングプロセスに関する洞察を明らかにする。
(i)適応の忠実さ
(ii)ダイアログの重要性
(iii)物語順の保存、及び
(iv)bechdelテストを反映した性表現問題。
関連論文リスト
- Scene Graph Generation with Role-Playing Large Language Models [50.252588437973245]
オープン語彙シーングラフ生成(OVSGG)に対する現在のアプローチは、CLIPのような視覚言語モデルを使用している。
シーン固有の記述に基づくOVSGGフレームワークであるSDSGGを提案する。
対象と対象の複雑な相互作用を捉えるために,相互視覚アダプタと呼ばれる軽量モジュールを提案する。
論文 参考訳(メタデータ) (2024-10-20T11:40:31Z) - DiscoGraMS: Enhancing Movie Screen-Play Summarization using Movie Character-Aware Discourse Graph [6.980991481207376]
映画脚本を映画キャラクタ対応の談話グラフ(CaD Graph)として表現する新しいリソースであるDiscoGraMSを紹介する。
このモデルは、スクリーンプレイの内容をより包括的で忠実に表現することで、すべての健全な情報を保存することを目的としている。
論文 参考訳(メタデータ) (2024-10-18T17:56:11Z) - ScreenWriter: Automatic Screenplay Generation and Movie Summarisation [55.20132267309382]
ビデオコンテンツは、ユーザーがキープロットポイントをリコールしたり、見ずに概要を見ることができるようなテキスト記述や要約の需要を駆り立ててきた。
本稿では,映像のみを操作し,対話,話者名,シーンブレーク,視覚的記述を含む出力を生成するScreenWriterを提案する。
ScreenWriterは、映像を視覚ベクトルのシーケンスに基づいてシーンに分割する新しいアルゴリズムを導入し、アクターの顔のデータベースに基づく文字名決定の難しい問題に対する新しい方法を提案する。
論文 参考訳(メタデータ) (2024-10-17T07:59:54Z) - Interconnected Kingdoms: Comparing 'A Song of Ice and Fire' Adaptations Across Media Using Complex Networks [2.653724344357519]
そこで本稿では,メディア間の文字マッチングとネットワークにおけるそれらの位置比較を行う手法を提案する。
我々は,G.R.R.マーティンによる新シリーズ『氷と火の歌』とその漫画・テレビ番組の翻案にこれらの手法を適用した。
論文 参考訳(メタデータ) (2024-10-07T19:35:46Z) - Learning to Localize Actions in Instructional Videos with LLM-Based Multi-Pathway Text-Video Alignment [53.12952107996463]
本研究は,訓練ビデオにおけるプロシージャステップの時間的境界をローカライズするための新しいトレーニングフレームワークを提案する。
手続き理解とテキスト要約におけるLLM(Large Language Models)の強みに感銘を受けて,まずLLMを適用し,課題関連情報を抽出し,課題関連手順をナレーションから要約する。
LLMステップとトレーニング用ビデオとの信頼性の高い擬似マッチングを生成するために,MPTVA(Multi-Pathway Text-Video Alignment)戦略を提案する。
論文 参考訳(メタデータ) (2024-09-22T18:40:55Z) - Movie101v2: Improved Movie Narration Benchmark [53.54176725112229]
映像の自動ナレーションは、視覚障害者を支援するために、映像に合わせたプロット記述を生成することを目的としている。
映画ナレーションに特化して設計されたデータ品質を向上した大規模バイリンガルデータセットであるMovie101v2を紹介する。
新しいベンチマークに基づいて,GPT-4Vを含む多数の視覚言語モデルをベースライン化し,ナレーション生成における課題の詳細な分析を行う。
論文 参考訳(メタデータ) (2024-04-20T13:15:27Z) - Select and Summarize: Scene Saliency for Movie Script Summarization [11.318175666743656]
そこで本研究では,100本の映画に対して,人間による注釈付きサリエントシーンからなるシーン・サリエンシ・データセットを提案する。
そこで本研究では,まずスクリプト中の健全なシーンを識別し,そのシーンのみを用いて要約を生成する2段階の抽象要約手法を提案する。
論文 参考訳(メタデータ) (2024-04-04T16:16:53Z) - Contextualized Diffusion Models for Text-Guided Image and Video Generation [67.69171154637172]
条件拡散モデルは高忠実度テキスト誘導視覚生成および編集において優れた性能を示した。
本研究では,テキスト条件と視覚的サンプル間の相互作用とアライメントを包含するクロスモーダルコンテキストを組み込むことにより,コンテキスト拡散モデル(ContextDiff)を提案する。
理論的導出を伴うDDPMとDDIMの両方にモデルを一般化し、テキスト・ツー・イメージ生成とテキスト・ツー・ビデオ編集という2つの課題を伴う評価において、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T15:01:16Z) - GNAT: A General Narrative Alignment Tool [12.100007440638667]
バイオインフォマティクスと現代のテキスト類似度指標を結合したSmith-Watermanアルゴリズムのナラティブアライメントに対する一般的なアプローチを開発する。
文書の相対長と絶対長の両方で大きく異なる4つの異なる問題領域に対して、一般的な物語アライメントツール(GNAT)を適用し、評価する。
論文 参考訳(メタデータ) (2023-11-07T00:24:14Z) - Temporal Perceiving Video-Language Pre-training [112.1790287726804]
本研究は、時間的・意味的な微粒なアライメントを可能にする、新しいテキスト-ビデオのローカライゼーション・プレテキストタスクを導入する。
具体的には、テキスト-ビデオのローカライゼーションは、テキスト記述が与えられたビデオの開始と終了の境界を予測するモーメント検索から成っている。
提案手法は,細粒度フレーム表現と単語表現を結合し,単一モードにおける異なるインスタンスの表現を暗黙的に区別する。
論文 参考訳(メタデータ) (2023-01-18T12:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。