Fugu-MT 論文翻訳(概要): S2ED: From Story to Executable Descriptions for Consistency-Aware Story Illustration

論文の概要: S2ED: From Story to Executable Descriptions for Consistency-Aware Story Illustration

arxiv url: http://arxiv.org/abs/2605.22448v1
Date: Thu, 21 May 2026 13:16:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-22 20:14:18.569998
Title: S2ED: From Story to Executable Descriptions for Consistency-Aware Story Illustration
Title（参考訳）: S2ED: ストーリーから実行可能な説明まで
Authors: Sijing Yin, Jiamou Liu, Xiao Tang, Yaser Shakib, Qian Liu,
Abstract要約: 複数フレームのストーリーイラストは、単一画像のテキスト・ツー・イメージ生成を超えて、長い水平コヒーレンスを必要とする。本稿では,S2ED(Story-to-Executable Descriptions)を提案する。 S2EDは、完全なストーリーを、より一貫性のあるレンダリングのために、明示的で編集可能な実行可能な記述のシーケンスに変換する。
参考スコア（独自算出の注目度）: 13.916602727442376
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-frame story illustration requires long-horizon coherence beyond single-image text-to-image generation, including narrative decomposition and persistent character identity, layout, and affect across frames. We propose Story-to-Executable Descriptions (S2ED), a training-free, model-agnostic, prompt-layer framework that converts a full story into a sequence of explicit, editable executable descriptions for more consistent rendering. S2ED coordinates three agents to segment the narrative, ground canonical character attributes, and enrich spatial and affective cues, enabling interpretable prompt-carried state propagation and local edits to repair drift without retraining the generator. Experiments on Flintstones and Shakoo Maku show that S2ED improves sequence-level consistency and character fidelity over strong prompting, large-model planning, and a reference training-based method, under both automatic metrics and human judgments. We also deploy S2ED in an end-to-end story-to-storybook system for children's illustrated stories, with a supplementary video.
Abstract（参考訳）: 複数フレームのストーリーイラストは、物語の分解や永続的なキャラクタのアイデンティティ、レイアウト、フレーム間の影響を含む、単一イメージのテキスト・ツー・イメージ生成を超えて、長い水平コヒーレンスを必要とする。本稿では,S2ED(Story-to-Executable Descriptions)を提案する。S2ED(Story-to-Executable Descriptions)は,トレーニング不要で,モデルに依存しない,プロンプトレイヤフレームワークである。 S2EDは3つのエージェントをコーディネートして、物語、地上の標準文字属性をセグメンテーションし、空間的および感情的な手がかりを豊かにし、解釈可能なプロンプトを運んだ状態の伝播と局所的な編集を可能にし、ジェネレータをリトレーニングすることなくドリフトを修復する。 Flintstones と Shakoo Maku の実験では、S2ED は強力なプロンプトや大規模モデル計画、参照学習に基づく手法よりも、自動測定と人的判断の両方でシーケンスレベルの一貫性と文字の忠実性を向上させる。また,S2EDを子どものイラスト入りストーリーのエンドツーエンドのストーリー・ツー・ストーリーブックシステムに,補足ビデオで展開する。

関連論文リスト

FairyGen: Storied Cartoon Video from a Single Child-Drawn Character [15.701180508477679]
本研究では,一人の子どもの絵から物語駆動のマンガ映像を自動生成するFairyGenを提案する。以前のストーリーテリング方法とは異なり、FairyGenはスタイル化された背景生成から文字モデリングを明示的に切り離している。我々のシステムは、スタイリスティックに忠実で、物語的に構造化された自然運動のアニメーションを生成する。
論文参考訳（メタデータ） (2025-06-26T13:58:16Z)
STORYANCHORS: Generating Consistent Multi-Scene Story Frames for Long-Form Narratives [82.19488717416351]
本稿では,高品質でマルチシーンなストーリーフレームを生成するための統合フレームワークであるStoryAnchorsを紹介する。 StoryAnchorsは、時間的一貫性を確保するために、過去と将来の両方のコンテキストを統合する双方向のストーリージェネレータを使用している。また、マルチイベントストーリーフレームラベリングとプログレッシブストーリーフレームトレーニングを統合し、モデルが包括的な物語の流れとイベントレベルのダイナミクスの両方をキャプチャできるようにする。
論文参考訳（メタデータ） (2025-05-13T08:48:10Z)
StoryWeaver: A Unified World Model for Knowledge-Enhanced Story Character Customization [36.14275850149665]
本稿では,様々なストーリー関連知識を包括的に表現した新しい知識グラフ,すなわちキャラクタグラフ(textbfCG)を提案する。次に、リッチテキストセマンティクスと一貫したストーリー視覚化が可能な、キャラクタグラフ(textbfC-CG)によるカスタマイズを実現するイメージジェネレータであるStoryWeaverを紹介する。
論文参考訳（メタデータ） (2024-12-10T10:16:50Z)
ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context [50.572907418430155]
ContextualStoryは、コヒーレントなストーリーフレームを生成し、ビジュアルなストーリーテリングのためにフレームを拡張するように設計されたフレームワークである。ストーリーライン埋め込みにおけるコンテキストを豊かにするストーリーラインコンテクストアライザと、フレーム間のシーン変化を測定するストーリーフローアダプタを導入する。 PororoSVとFlintstonesSVデータセットの実験では、ContextualStoryはストーリーの可視化と継続の両方で既存のSOTAメソッドよりも大幅に優れています。
論文参考訳（メタデータ） (2024-07-13T05:02:42Z)
TaleCrafter: Interactive Story Visualization with Multiple Characters [49.14122401339003]
本稿では,ジェネリック・インタラクティブ・ストーリー・ビジュアライゼーションシステムを提案する。複数の新しい文字を扱うことができ、レイアウトと局所構造の編集をサポートする。システムは、ストーリー・ツー・プロンプト・ジェネレーション(S2P)、テキスト・ツー・ジェネレーション(T2L)、制御可能なテキスト・ツー・イメージ・ジェネレーション(C-T2I)、画像・トゥ・ビデオ・アニメーション(I2V)の4つの相互接続コンポーネントからなる。
論文参考訳（メタデータ） (2023-05-29T17:11:39Z)
PlotMachines: Outline-Conditioned Generation with Dynamic Plot State Tracking [128.76063992147016]
PlotMachinesは、動的プロット状態を追跡することによってアウトラインをコヒーレントなストーリーに変換することを学習する、ニューラルな物語モデルである。さらに,PlotMachinesを高レベルな談話構造で強化し,モデルが物語の異なる部分に対応する筆記スタイルを学習できるようにした。
論文参考訳（メタデータ） (2020-04-30T17:16:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。