論文の概要: CANVAS: Continuity-Aware Narratives via Visual Agentic Storyboarding
- arxiv url: http://arxiv.org/abs/2604.13452v1
- Date: Wed, 15 Apr 2026 04:03:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.372216
- Title: CANVAS: Continuity-Aware Narratives via Visual Agentic Storyboarding
- Title(参考訳): CANVAS:ビジュアルエージェントによる物語の連続性認識
- Authors: Ishani Mondal, Yiwen Song, Mihir Parmar, Palash Goyal, Jordan Boyd-Graber, Tomas Pfister, Yale Song,
- Abstract要約: CANVAS(Continuity-Aware Narratives via Visual Agentic Storyboarding)は、マルチショット物語における視覚的連続性を明示的に計画するフレームワークである。
CanVASは、文字連続性、永続的なバックグラウンドアンカー、同じ設定内でスムーズな遷移のための位置認識シーン計画を通じてコヒーレンスを強制する。
CanVASは最高性能のベースラインを一貫して上回り、バックグラウンドの連続性を21.6%改善し、文字の一貫性を9.6%改善し、プロップの一貫性を7.6%向上させた。
- 参考スコア(独自算出の注目度): 42.019364891397395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-form visual storytelling requires maintaining continuity across shots, including consistent characters, stable environments, and smooth scene transitions. While existing generative models can produce strong individual frames, they fail to preserve such continuity, leading to appearance changes, inconsistent backgrounds, and abrupt scene shifts. We introduce CANVAS (Continuity-Aware Narratives via Visual Agentic Storyboarding), a multi-agent framework that explicitly plans visual continuity in multi-shot narratives. CANVAS enforces coherence through character continuity, persistent background anchors, and location-aware scene planning for smooth transitions within the same setting We evaluate CANVAS on two storyboard generation benchmarks ST-BENCH and ViStoryBench and introduce a new challenging benchmark HardContinuityBench for long-range narrative consistency. CANVAS consistently outperforms the best-performing baseline, improving background continuity by 21.6%, character consistency by 9.6% and props consistency by 7.6%.
- Abstract(参考訳): ロングフォームなビジュアルストーリーテリングでは、一貫したキャラクター、安定した環境、スムーズなシーン遷移を含むショット間の連続性を維持する必要がある。
既存の生成モデルは、強い個々のフレームを生成することができるが、そのような連続性を維持することができず、外観の変化、一貫性のない背景、突然のシーンシフトにつながる。
CANVAS(Continuity-Aware Narratives via Visual Agentic Storyboarding)は、マルチショット物語における視覚的連続性を明示的に計画するマルチエージェントフレームワークである。
CANVASは、キャラクタの連続性、永続的な背景アンカー、同一設定内でのスムーズな遷移のための位置認識シーンプランニングを通じて、コヒーレンスを強制する。
CANVASは最高性能のベースラインを一貫して上回り、バックグラウンドの連続性を21.6%改善し、文字の一貫性を9.6%改善し、プロップの一貫性を7.6%向上させた。
関連論文リスト
- InfinityStory: Unlimited Video Generation with World Consistency and Character-Aware Shot Transitions [137.1784538723039]
本稿では,ビデオ合成における3つの限界に対処する新しいフレームワーク,データセット,モデルを提案する。
ショット間のバックグラウンド一貫性、シームレスなマルチオブジェクトショット・ツー・ショット・トランジション、時間単位の物語へのスケーラビリティに対処する。
本稿では,複数の被写体が入射する複雑なシナリオに対してスムーズなショット遷移を生成するトランジション対応ビデオ合成モジュールを提案する。
論文 参考訳(メタデータ) (2026-03-04T02:10:32Z) - StoryTailor:A Zero-Shot Pipeline for Action-Rich Multi-Subject Visual Narratives [7.243114047801061]
本稿では、時間的コヒーレントなアイデンティティ保存画像列を生成するゼロショットパイプラインを提案する。
ストーリーは表現力のあるインタラクションを提供し、安定したシーンを進化させる。
論文 参考訳(メタデータ) (2026-02-24T16:07:02Z) - STORYANCHORS: Generating Consistent Multi-Scene Story Frames for Long-Form Narratives [82.19488717416351]
本稿では,高品質でマルチシーンなストーリーフレームを生成するための統合フレームワークであるStoryAnchorsを紹介する。
StoryAnchorsは、時間的一貫性を確保するために、過去と将来の両方のコンテキストを統合する双方向のストーリージェネレータを使用している。
また、マルチイベントストーリーフレームラベリングとプログレッシブストーリーフレームトレーニングを統合し、モデルが包括的な物語の流れとイベントレベルのダイナミクスの両方をキャプチャできるようにする。
論文 参考訳(メタデータ) (2025-05-13T08:48:10Z) - VideoGen-of-Thought: Step-by-step generating multi-shot video with minimal manual intervention [70.61101071902596]
現在のビデオ生成モデルは短いクリップで優れているが、解離した視覚力学と破折したストーリーラインのため、凝集性のある複数ショットの物語を生成できない。
一つの文から複数ショットのビデオ合成を自動化する,ステップバイステップのフレームワークであるVideoGen-of-Thought (VGoT)を紹介した。
VGoTは、ショット内の顔の一貫性が20.4%、スタイルの一貫性が17.4%向上するマルチショットビデオを生成する。
論文 参考訳(メタデータ) (2025-03-19T11:59:14Z) - VideoGen-of-Thought: Step-by-step generating multi-shot video with minimal manual intervention [76.3175166538482]
VideoGen-of-Thought(VGoT)は、単一の文から複数ショットのビデオ合成を自動化するステップバイステップのフレームワークである。
VGoTは、ナラティブな断片化、視覚的不整合、トランジションアーティファクトの3つの課題に対処する。
トレーニング不要のパイプラインで組み合わせられたVGoTは、ショット内面の一貫性が20.4%、スタイルの一貫性が17.4%向上した。
論文 参考訳(メタデータ) (2024-12-03T08:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。