論文の概要: Envisioning Narrative Intelligence: A Creative Visual Storytelling
Anthology
- arxiv url: http://arxiv.org/abs/2310.04529v1
- Date: Fri, 6 Oct 2023 18:47:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 17:49:03.411872
- Title: Envisioning Narrative Intelligence: A Creative Visual Storytelling
Anthology
- Title(参考訳): ナラティブ・インテリジェンス:創造的なビジュアル・ストーリーテリング・アンソロジー
- Authors: Brett A. Halperin and Stephanie M. Lukin
- Abstract要約: この創造的なビジュアルなストーリーテリングプロセスで見られるバリエーションを特徴付ける5つのテーマを提示する。
我々は、計算的なビジュアルストーリーテリングのための物語知能基準を、創造的で、信頼性があり、表現力があり、基礎があり、責任があるものとして想定する。
- 参考スコア(独自算出の注目度): 7.962160810367763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we collect an anthology of 100 visual stories from authors who
participated in our systematic creative process of improvised story-building
based on image sequences. Following close reading and thematic analysis of our
anthology, we present five themes that characterize the variations found in
this creative visual storytelling process: (1) Narrating What is in Vision vs.
Envisioning; (2) Dynamically Characterizing Entities/Objects; (3) Sensing
Experiential Information About the Scenery; (4) Modulating the Mood; (5)
Encoding Narrative Biases. In understanding the varied ways that people derive
stories from images, we offer considerations for collecting story-driven
training data to inform automatic story generation. In correspondence with each
theme, we envision narrative intelligence criteria for computational visual
storytelling as: creative, reliable, expressive, grounded, and responsible.
From these criteria, we discuss how to foreground creative expression, account
for biases, and operate in the bounds of visual storyworlds.
- Abstract(参考訳): 本稿では,画像シーケンスに基づく即興的なストーリー構築の体系的創造プロセスに参加した著者から,100のビジュアルストーリーのアンソロジーを収集する。
この創造的な視覚的ストーリーテリングの過程における変化を特徴付ける5つのテーマについて述べる。(1) 視覚的ストーリーテリングの過程における変化を物語ること、(2) 対象と対象を動的に特徴付けること、(3) 風景に関する経験的情報をセンシングすること、(4) ムードを変調すること、(5) 物語ビザをエンコードすること。
人々が画像からストーリーを導き出す様々な方法を理解するために、私たちはストーリー駆動学習データを収集し、自動ストーリー生成を知らせる。
それぞれのテーマに対応して,創造性,信頼性,表現力,接地性,責任感といった,コンピュータ的なビジュアルストーリーテリングにおけるナラティブインテリジェンスの基準を想定する。
これらの基準から,クリエイティビティ表現のフォアグラウンド,バイアスの考慮,ビジュアルストーリーワールドの境界での操作について論じる。
関連論文リスト
- Generating Visual Stories with Grounded and Coreferent Characters [63.07511918366848]
本稿では,一貫した接地的・中核的な特徴を持つ視覚的ストーリーを予測できる最初のモデルを提案する。
我々のモデルは、広く使われているVISTベンチマークの上に構築された新しいデータセットに基づいて微調整されています。
また、物語における文字の豊かさとコア参照を測定するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2024-09-20T14:56:33Z) - TARN-VIST: Topic Aware Reinforcement Network for Visual Storytelling [14.15543866199545]
クロスモーダルなタスクとして、視覚的なストーリーテリングは、順序付けられた画像シーケンスのためのストーリーを自動的に生成することを目的としている。
視覚的ストーリーテリングのための新しい手法,Topic Aware Reinforcement Network(TARN-VIST)を提案する。
特に,視覚的,言語的両面から,物語の話題情報を事前に抽出した。
論文 参考訳(メタデータ) (2024-03-18T08:01:23Z) - SCO-VIST: Social Interaction Commonsense Knowledge-based Visual
Storytelling [12.560014305032437]
本稿では、画像シーケンスをオブジェクトと関係を持つグラフとして表現するフレームワークであるSCO-VISTを紹介する。
SCO-VIST はこのグラフをプロットポイントを表し、意味的および発生に基づくエッジウェイトを持つプロットポイント間のブリッジを生成する。
この重み付きストーリーグラフは、Floyd-Warshallのアルゴリズムを用いて一連のイベントでストーリーラインを生成する。
論文 参考訳(メタデータ) (2024-02-01T04:09:17Z) - Visual Storytelling with Question-Answer Plans [70.89011289754863]
本稿では、事前訓練された言語モデルと計画に視覚表現を統合する新しいフレームワークを提案する。
我々のモデルは、画像列を視覚的な接頭辞、つまり言語モデルで解釈できる連続的な埋め込みの列に変換する。
また、一連の質問と回答のペアを青写真プランとして利用して、健全な視覚概念を選択し、物語にどのように組み立てるべきかを決定する。
論文 参考訳(メタデータ) (2023-10-08T21:45:34Z) - ViNTER: Image Narrative Generation with Emotion-Arc-Aware Transformer [59.05857591535986]
様々な感情を「感情弧」として表現する時系列に焦点をあてた画像物語を生成するモデルViNTERを提案する。
手動評価と自動評価の両方の実験結果を示す。
論文 参考訳(メタデータ) (2022-02-15T10:53:08Z) - Telling Creative Stories Using Generative Visual Aids [52.623545341588304]
私たちはライターに、開始プロンプトからクリエイティブなストーリーを書くように頼み、同じプロンプトから生成するAIモデルによって生成されたビジュアルを提供した。
コントロールグループと比較すると、ビジュアルをストーリー・ライティング・アシストとして使用した作家は、より創造的で、オリジナルで、完全で、視覚的にできるストーリーを著した。
発見は、AIによる横断的なモダリティ入力は、人間とAIの共創において創造性の異なる側面に利益をもたらすが、収束する思考を妨げることを示している。
論文 参考訳(メタデータ) (2021-10-27T23:13:47Z) - A guided journey through non-interactive automatic story generation [0.0]
この記事では,創造的システムに対する要件,創造性の3種類のモデル(計算的,社会文化的,個人的),人間の創造的記述のモデルについて述べる。
この記事は、伝達すべき主要なアイデアの自律的生成と採用、創造性を保証する基準の自律的設計が、おそらく将来の研究において最も重要なトピックの2つである、と結論付けている。
論文 参考訳(メタデータ) (2021-10-08T10:01:36Z) - PlotMachines: Outline-Conditioned Generation with Dynamic Plot State
Tracking [128.76063992147016]
PlotMachinesは、動的プロット状態を追跡することによってアウトラインをコヒーレントなストーリーに変換することを学習する、ニューラルな物語モデルである。
さらに,PlotMachinesを高レベルな談話構造で強化し,モデルが物語の異なる部分に対応する筆記スタイルを学習できるようにした。
論文 参考訳(メタデータ) (2020-04-30T17:16:31Z) - Hide-and-Tell: Learning to Bridge Photo Streams for Visual Storytelling [86.42719129731907]
視覚的ギャップを埋めるストーリーラインを明示的に学習することを提案する。
私たちは、欠落した写真であっても、ネットワークをトレーニングして、完全なプラウティブルなストーリーを作り出す。
実験では,本手法とネットワーク設計がストーリーテリングに有効であることを示す。
論文 参考訳(メタデータ) (2020-02-03T14:22:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。