論文の概要: ScriptViz: A Visualization Tool to Aid Scriptwriting based on a Large Movie Database
- arxiv url: http://arxiv.org/abs/2410.03224v1
- Date: Fri, 4 Oct 2024 08:23:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-03 02:54:39.809229
- Title: ScriptViz: A Visualization Tool to Aid Scriptwriting based on a Large Movie Database
- Title(参考訳): ScriptViz: 大規模な映画データベースに基づくスクリプト作成を支援する可視化ツール
- Authors: Anyi Rao, Jean-Peïc Chou, Maneesh Agrawala,
- Abstract要約: ScriptVizは、スクリプトのテキストと大きな映画データベースからの対話に基づいて、参照ビジュアルをリアルタイムで検索する。
15のスクリプトのユーザ評価は、ScriptVizが一貫した、かつ多様な視覚的可能性を持つスクリプトを提示できることを示している。
- 参考スコア(独自算出の注目度): 25.063210369098403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scriptwriters usually rely on their mental visualization to create a vivid story by using their imagination to see, feel, and experience the scenes they are writing. Besides mental visualization, they often refer to existing images or scenes in movies and analyze the visual elements to create a certain mood or atmosphere. In this paper, we develop ScriptViz to provide external visualization based on a large movie database for the screenwriting process. It retrieves reference visuals on the fly based on scripts' text and dialogue from a large movie database. The tool provides two types of control on visual elements that enable writers to 1) see exactly what they want with fixed visual elements and 2) see variances in uncertain elements. User evaluation among 15 scriptwriters shows that ScriptViz is able to present scriptwriters with consistent yet diverse visual possibilities, aligning closely with their scripts and helping their creation.
- Abstract(参考訳): スクリプトライターは通常、自分の心の可視化に頼って、自分の想像力を使って、自分が書いているシーンを見たり、感じたり、経験したりすることで、鮮やかなストーリーを作る。
メンタルヴィジュアライゼーションの他に、映画内の既存のイメージやシーンを参照し、視覚要素を分析して特定の雰囲気や雰囲気を作り出すことも多い。
本稿では,スクリーンライティングプロセスのための大規模映画データベースをベースとした外部可視化を実現するためのScriptVizを開発する。
スクリプトのテキストと対話に基づいて、大規模な映画データベースから参照ビジュアルをリアルタイムで取得する。
このツールは、作者が視覚的要素を制御できる2つのタイプのコントロールを提供する。
1) 固定された視覚要素で何が欲しいか正確に確認し、
2)不確実な要素の分散を見よ。
15人のスクリプト作者のユーザ評価によると、ScriptVizは、スクリプトと密に連携し、スクリプトの作成を支援する、一貫性がありながら多様な視覚的可能性を持つスクリプトを提示できる。
関連論文リスト
- ScreenWriter: Automatic Screenplay Generation and Movie Summarisation [55.20132267309382]
ビデオコンテンツは、ユーザーがキープロットポイントをリコールしたり、見ずに概要を見ることができるようなテキスト記述や要約の需要を駆り立ててきた。
本稿では,映像のみを操作し,対話,話者名,シーンブレーク,視覚的記述を含む出力を生成するScreenWriterを提案する。
ScreenWriterは、映像を視覚ベクトルのシーケンスに基づいてシーンに分割する新しいアルゴリズムを導入し、アクターの顔のデータベースに基づく文字名決定の難しい問題に対する新しい方法を提案する。
論文 参考訳(メタデータ) (2024-10-17T07:59:54Z) - Beyond Embeddings: The Promise of Visual Table in Visual Reasoning [38.558250602212425]
視覚的推論に適した新しい視覚表現形式である視覚表を提案する。
ビジュアルテーブルは、視覚シーンの階層的な記述として構築され、シーン記述と複数のオブジェクト中心の記述が特徴である。
それらは、視覚的推論に不可欠な、インスタンスレベルの世界知識と詳細な属性を提供します。
論文 参考訳(メタデータ) (2024-03-27T04:49:23Z) - TaleCrafter: Interactive Story Visualization with Multiple Characters [49.14122401339003]
本稿では,ジェネリック・インタラクティブ・ストーリー・ビジュアライゼーションシステムを提案する。
複数の新しい文字を扱うことができ、レイアウトと局所構造の編集をサポートする。
システムは、ストーリー・ツー・プロンプト・ジェネレーション(S2P)、テキスト・ツー・ジェネレーション(T2L)、制御可能なテキスト・ツー・イメージ・ジェネレーション(C-T2I)、画像・トゥ・ビデオ・アニメーション(I2V)の4つの相互接続コンポーネントからなる。
論文 参考訳(メタデータ) (2023-05-29T17:11:39Z) - DEVICE: DEpth and VIsual ConcEpts Aware Transformer for TextCaps [10.87327544629769]
テキストキャプチャのためのDEVICE(Depth and VIsual ConcEpts Aware Transformer)を提案する。
我々の装置は、より包括的にシーンを一般化し、記述された視覚的実体の精度を高めることができる。
論文 参考訳(メタデータ) (2023-02-03T04:31:13Z) - Visualize Before You Write: Imagination-Guided Open-Ended Text
Generation [68.96699389728964]
我々は、機械生成画像を用いて、オープンエンドテキスト生成における言語モデルをガイドするiNLGを提案する。
オープンエンドテキスト生成タスクにおけるiNLGの有効性について実験と解析を行った。
論文 参考訳(メタデータ) (2022-10-07T18:01:09Z) - VScript: Controllable Script Generation with Audio-Visual Presentation [56.17400243061659]
VScriptは、対話やシーン記述を含む完全なスクリプトを生成するコントロール可能なパイプラインである。
我々は階層構造を採用し、プロットを生成し、次にスクリプトとその音声視覚提示を行う。
実験の結果,本手法は,自動評価と人的評価の両方において,ベースラインよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-01T09:43:02Z) - LAViTeR: Learning Aligned Visual and Textual Representations Assisted by Image and Caption Generation [5.064384692591668]
本稿では,視覚およびテキスト表現学習のための新しいアーキテクチャであるLAViTeRを提案する。
メインモジュールであるVisual Textual Alignment (VTA)は、GANベースの画像合成とイメージキャプションという2つの補助的なタスクによって支援される。
CUBとMS-COCOの2つの公開データセットに対する実験結果は、優れた視覚的およびテキスト的表現アライメントを示す。
論文 参考訳(メタデータ) (2021-09-04T22:48:46Z) - Where to look at the movies : Analyzing visual attention to understand
movie editing [75.16856363008128]
映画シーケンスの視線パターン情報を含む新しい視線追跡データベースを提案する。
このデータセット上で、最先端の計算サリエンシー技術がどのように振る舞うかを示す。
論文 参考訳(メタデータ) (2021-02-26T09:54:58Z) - Vision and Language: from Visual Perception to Content Creation [100.36776435627962]
言語へのビジョン"は、おそらく過去5年で最も人気のあるトピックの1つである。
本稿は、これらの2つの側面に沿った最近の進歩、すなわち「言語へのビジョン」と「視覚への言語」を概観する。
論文 参考訳(メタデータ) (2019-12-26T14:07:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。