論文の概要: Persistent Story World Simulation with Continuous Character Customization
- arxiv url: http://arxiv.org/abs/2603.16285v1
- Date: Tue, 17 Mar 2026 09:17:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.192927
- Title: Persistent Story World Simulation with Continuous Character Customization
- Title(参考訳): 連続的なキャラクタカスタマイズによる永続的ストーリーワールドシミュレーション
- Authors: Jinlu Zhang, Qiyun Wang, Baoxiang Du, Jiayi Ji, Jing He, Rongsheng Zhang, Tangjie Lv, Xiaoshuai Sun, Rongrong Ji,
- Abstract要約: 本稿では,連続したストーリーキャラクタをカスタマイズするためのストーリーワールドシミュレータであるEverTaleを紹介する。
私たちのEverTaleは、シングルキャラクタとマルチキャラクタの両方のストーリービジュアライゼーションにおいて、より広範な比較手法に対して優れたパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 85.65195925369268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Story visualization has gained increasing attention in computer vision. However, current methods often fail to achieve a synergy between accurate character customization, semantic alignment, and continuous integration of new identities. To tackle this challenge, in this paper we present EverTale, a story world simulator for continuous story character customization. We first propose an All-in-One-World Character Integrator to achieve continuous character adaptation within unified LoRA module, eliminating the need for per-character optimization modules of previous methods. Then, we incorporate a Character Quality Gate via MLLM-as-Judge to ensure the fidelity of each character adaptation process through chain-of-thought reasoning, determining whether the model can proceed to the next character or require additional training on the current one. We also introduce a Character-Aware Region-Focus Sampling strategy to address the identity degradation and layout conflicts in existing multi-character visual storytelling, ensuring natural multi-character generation by harmonizing local character-specific details with global scene context with higher efficiency. Experimental results show that our EverTale achieves superior performance against a wider range of compared methods on both single- and multi-character story visualization. Codes will be available.
- Abstract(参考訳): ストーリービジュアライゼーションはコンピュータビジョンにおいて注目を集めている。
しかし、現在の手法は、正確な文字のカスタマイズ、セマンティックアライメント、新しいアイデンティティの継続的な統合の相乗効果を達成できないことが多い。
本稿では,この課題に対処するために,連続的なストーリーキャラクタのカスタマイズのためのストーリーワールドシミュレータであるEverTaleを紹介する。
まず,LoRAモジュール内での連続的な文字適応を実現するためのオールインワン・ワールド文字積分器を提案する。
次に,MLLM-as-Judgeを介してキャラクタ品質ゲートを組み,各キャラクタ適応プロセスの忠実度をチェーン・オブ・シント推論により保証し,モデルが次のキャラクタに進むことができるか,あるいは現在のキャラクタに追加のトレーニングが必要かを判断する。
また,既存のマルチキャラクタ・ビジュアル・ストーリーテリングにおけるアイデンティティの劣化とレイアウトの矛盾に対処し,ローカルなキャラクタ固有の詳細とグローバルなシーンコンテキストを高効率で調和させることにより,自然なマルチキャラクタ生成を実現するためのキャラクタ・アウェア・リージョン・フォーカスサンプリング戦略を導入する。
実験結果から,EverTaleは単文字と多文字の両方のストーリービジュアライゼーションにおいて,より広範な比較手法に対して優れた性能を発揮することが示された。
コードは利用可能。
関連論文リスト
- IdentityStory: Taming Your Identity-Preserving Generator for Human-Centric Story Generation [75.09818147405898]
IdentityStoryは人間中心のストーリー生成のためのフレームワークで、シーケンシャルな画像間で一貫した文字識別を保証する。
アイデンティティ保存ジェネレータを使用することで、フレームワークはIterative Identity DiscoveryとRe-denoising Identity Injectionという2つの重要なコンポーネントを備えている。
論文 参考訳(メタデータ) (2025-12-29T14:54:44Z) - CharCom: Composable Identity Control for Multi-Character Story Illustration [13.582635774872463]
CharComは、構成可能なLoRAアダプタを通じて、キャラクタ一貫性のあるストーリーイラストアを実現するフレームワークである。
マルチシーンの物語の実験では、CharComはキャラクタの忠実度、セマンティックアライメント、時間的コヒーレンスを著しく向上させる。
混み合ったシーンでは堅牢であり、最小限のオーバーヘッドでスケーラブルなマルチキャラクタ生成を可能にし、ストーリーイラストやアニメーションのような現実世界のアプリケーションに適している。
論文 参考訳(メタデータ) (2025-10-11T09:36:20Z) - StoryWeaver: A Unified World Model for Knowledge-Enhanced Story Character Customization [36.14275850149665]
本稿では,様々なストーリー関連知識を包括的に表現した新しい知識グラフ,すなわちキャラクタグラフ(textbfCG)を提案する。
次に、リッチテキストセマンティクスと一貫したストーリー視覚化が可能な、キャラクタグラフ(textbfC-CG)によるカスタマイズを実現するイメージジェネレータであるStoryWeaverを紹介する。
論文 参考訳(メタデータ) (2024-12-10T10:16:50Z) - CharacterBox: Evaluating the Role-Playing Capabilities of LLMs in Text-Based Virtual Worlds [74.02480671181685]
ロールプレイングは大規模言語モデル(LLM)の重要な機能である
現在の評価手法は, 実演に不可欠なニュアンス特性や動作を適切に把握するに足りていない。
本研究では,キャラクタボックスを提案する。キャラクタボックスは,キャラクタの微粒な挙動を再現するシミュレーションサンドボックスである。
論文 参考訳(メタデータ) (2024-12-07T12:09:35Z) - Storynizor: Consistent Story Generation via Inter-Frame Synchronized and Shuffled ID Injection [27.412361280397057]
本稿では,フレーム間キャラクタ一貫性の強いコヒーレントなストーリを生成するモデルであるStorynizorを紹介する。
Storynizorの主なイノベーションは、主要なモジュールであるID-SynchronizerとID-Injectorにある。
Storynizorのトレーニングを容易にするために、100,000の画像からなるStoryDBと呼ばれる新しいデータセットをキュレートした。
論文 参考訳(メタデータ) (2024-09-29T09:15:51Z) - Generating Visual Stories with Grounded and Coreferent Characters [63.07511918366848]
本稿では,一貫した接地的・中核的な特徴を持つ視覚的ストーリーを予測できる最初のモデルを提案する。
我々のモデルは、広く使われているVISTベンチマークの上に構築された新しいデータセットに基づいて微調整されています。
また、物語における文字の豊かさとコア参照を測定するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2024-09-20T14:56:33Z) - Evolving Storytelling: Benchmarks and Methods for New Character Customization with Diffusion Models [79.21968152209193]
ニューエピソード・ベンチマークを導入し、新しいキャラクターで新しいストーリーを生成する際の生成モデルの適応性を評価する。
EpicEvoは,新しいキャラクタをシームレスに統合した単一ストーリーで,拡散に基づくビジュアルストーリー生成モデルをカスタマイズする手法である。
論文 参考訳(メタデータ) (2024-05-20T07:54:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。