論文の概要: SkyReels-Text: Fine-grained Font-Controllable Text Editing for Poster Design
- arxiv url: http://arxiv.org/abs/2511.13285v1
- Date: Mon, 17 Nov 2025 12:02:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.19863
- Title: SkyReels-Text: Fine-grained Font-Controllable Text Editing for Poster Design
- Title(参考訳): SkyReels-Text: ポスターデザインのためのきめ細かいフォント構成可能なテキスト編集
- Authors: Yunjie Yu, Jingchen Wu, Junchen Zhu, Chunze Lin, Guibin Chen,
- Abstract要約: ポスターテキストを正確に編集するためのフォント制御可能な新しいフレームワークであるSkyReels-Textを紹介する。
本手法では,複数のテキスト領域の同時編集が可能で,それぞれが異なるスタイルで描画される。
SkyReels-Textはテキストの忠実さと視覚的リアリズムの両方において最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 8.272505030643039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artistic design such as poster design often demands rapid yet precise modification of textual content while preserving visual harmony and typographic intent, especially across diverse font styles. Although modern image editing models have grown increasingly powerful, they still fall short in fine-grained, font-aware text manipulation, limiting their utility in professional design workflows such as poster editing. To address this issue, we present SkyReels-Text, a novel font-controllable framework for precise poster text editing. Our method enables simultaneous editing of multiple text regions, each rendered in distinct typographic styles, while preserving the visual appearance of non-edited regions. Notably, our model requires neither font labels nor fine-tuning during inference: users can simply provide cropped glyph patches corresponding to their desired typography, even if the font is not included in any standard library. Extensive experiments on multiple datasets, including handwrittent text benchmarks, SkyReels-Text achieves state-of-the-art performance in both text fidelity and visual realism, offering unprecedented control over font families, and stylistic nuances. This work bridges the gap between general-purpose image editing and professional-grade typographic design.
- Abstract(参考訳): ポスターデザインのような芸術的デザインは、視覚的調和とタイポグラフィーの意図を保ちながら、テキストコンテンツの迅速かつ正確な修正を要求することが多い。
現代の画像編集モデルはますます強力になっているが、フォントを意識した細粒度のテキスト操作では依然として不足しており、ポスター編集のようなプロの設計ワークフローでは実用性が制限されている。
この問題に対処するために,ポスターテキストを正確に編集するためのフォント制御可能な新しいフレームワークであるSkyReels-Textを紹介した。
非編集領域の視覚的外観を保ちながら、異なるタイポグラフィスタイルで描画された複数のテキスト領域の同時編集を可能にする。
フォントが標準ライブラリに含まれていない場合でも,ユーザが希望するタイポグラフィに対応するグリフパッチをトリミングするだけでよい。
SkyReels-Textは、テキストの忠実さとビジュアルリアリズムの両方において最先端のパフォーマンスを実現し、フォントファミリに対する前例のない制御とスタイリスティックなニュアンスを提供する。
この研究は、汎用画像編集とプロフェッショナルグレードのタイポグラフィーデザインのギャップを埋めるものである。
関連論文リスト
- POSTA: A Go-to Framework for Customized Artistic Poster Generation [87.16343612086959]
POSTAは、カスタマイズされた芸術ポスター生成のためのモジュラーフレームワークである。
background Diffusionはユーザ入力に基づいてテーマ付きバックグラウンドを生成する。
設計MLLMはレイアウトとタイポグラフィー要素を生成し、背景スタイルと整合し補完する。
ArtText Diffusionはキーテキスト要素にスタイリングを追加する。
論文 参考訳(メタデータ) (2025-03-19T05:22:38Z) - DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models [115.62816053600085]
デザインイメージをテキスト記述から合成するフレームワークであるDesignDiffusionを提案する。
提案するフレームワークは,ユーザプロンプトから直接テキストおよびビジュアルデザイン要素を合成する。
視覚テキストから派生した特徴的な文字埋め込みを利用して入力プロンプトを強化する。
論文 参考訳(メタデータ) (2025-03-03T15:22:57Z) - ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations [10.511255146429805]
本研究は,フォントラベルアノテーションを使わずに,原画像のみを用いてフォント制御可能な多言語テキストレンダリングを実現することができることを示す。
本稿では,条件付き拡散モデルとテキストセグメンテーションモデルを統合したデータ駆動型ソリューションを提案する。
この実験は、ゼロショットテキストにおける我々のアルゴリズムの概念の証明と、多様なフォントや言語にわたるフォント編集を提供する。
論文 参考訳(メタデータ) (2025-02-16T05:30:18Z) - Text-Driven Image Editing via Learnable Regions [74.45313434129005]
本研究では,ユーザが提供するマスクやスケッチを必要とせずに,テキストプロンプトによって駆動される領域ベースの画像編集手法を提案する。
この単純なアプローチにより、現在の画像生成モデルと互換性のあるフレキシブルな編集が可能になることを示す。
実験では,提案した言語記述に対応する忠実度とリアリズムの高い画像の操作において,提案手法の競合性能を示す。
論文 参考訳(メタデータ) (2023-11-28T02:27:31Z) - TextPainter: Multimodal Text Image Generation with Visual-harmony and
Text-comprehension for Poster Design [50.8682912032406]
本研究では,テキスト画像を生成するための新しいマルチモーダルアプローチであるTextPainterを紹介する。
TextPainterは、グローバルなローカル背景画像をスタイルのヒントとして取り、テキスト画像生成を視覚調和でガイドする。
約80Kのポスターに文レベルのバウンディングボックスとテキストの内容が付加されたPosterT80Kデータセットを構築した。
論文 参考訳(メタデータ) (2023-08-09T06:59:29Z) - FASTER: A Font-Agnostic Scene Text Editing and Rendering Framework [19.564048493848272]
STE(Scene Text Editing)は、画像中の既存のテキストの変更を主な目的とする、難しい研究課題である。
既存のスタイル変換ベースのアプローチでは、複雑な画像背景、多様なフォント属性、テキスト内の様々な単語長によるサブパー編集性能が示されている。
フォントに依存しない新しいシーンテキスト編集・レンダリングフレームワークであるFASTERを提案し,任意のスタイルや場所のテキストを同時に生成する。
論文 参考訳(メタデータ) (2023-08-05T15:54:06Z) - Improving Diffusion Models for Scene Text Editing with Dual Encoders [44.12999932588205]
シーンテキスト編集(Scene text editing)は、特定のテキストを画像に修正または挿入する作業である。
拡散モデルの最近の進歩は、これらの制限をテキスト条件による画像編集で克服することを約束している。
デュアルエンコーダ設計による事前学習拡散モデルを改善するためにDIFFSTEを提案する。
論文 参考訳(メタデータ) (2023-04-12T02:08:34Z) - Imagen Editor and EditBench: Advancing and Evaluating Text-Guided Image
Inpainting [53.708523312636096]
本稿では,テキスト誘導画像のインペイントを微調整し,カスケード拡散モデルであるImagen Editorを提案する。
編集はテキストプロンプトに忠実で、オブジェクト検出器を使用してトレーニング中に塗装マスクを提案する。
質的,定量的な評価を改善するために,テキスト誘導画像の塗り絵の体系的ベンチマークであるEditBenchを導入する。
論文 参考訳(メタデータ) (2022-12-13T21:25:11Z) - GenText: Unsupervised Artistic Text Generation via Decoupled Font and
Texture Manipulation [30.654807125764965]
我々は,汎用的な芸術的テクストスタイルの転送を実現するために,GenTextという新しいアプローチを提案する。
具体的には、スタイラス化、デスティル化、フォント転送という3つの異なる段階を取り入れています。
ペアの芸術的テキスト画像の取得が困難であることを考えると,本モデルは教師なし環境下で設計されている。
論文 参考訳(メタデータ) (2022-07-20T04:42:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。