論文の概要: PSDesigner: Automated Graphic Design with a Human-Like Creative Workflow
- arxiv url: http://arxiv.org/abs/2603.25738v1
- Date: Thu, 26 Mar 2026 17:59:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.431278
- Title: PSDesigner: Automated Graphic Design with a Human-Like Creative Workflow
- Title(参考訳): PSDesigner: 人風のクリエイティブワークフローを備えたグラフィックデザインの自動化
- Authors: Xincheng Shuai, Song Tang, Yutong Huang, Henghui Ding, Dacheng Tao,
- Abstract要約: PSDesignerは、人間のデザイナーの創造的なワークフローをエミュレートするグラフィックデザインシステムである。
PSDesignerはユーザ命令に基づいてテーマ関連資産を収集し、設計ファイルを操作するためのツールコールを自律的に推論して実行する。
強力なツール利用能力を持つシステムを実現するため,大量の高品質なPSD設計ファイルを含む設計データセットであるCreativePSDを構築した。
- 参考スコア(独自算出の注目度): 80.29423400249944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graphic design is a creative and innovative process that plays a crucial role in applications such as e-commerce and advertising. However, developing an automated design system that can faithfully translate user intentions into editable design files remains an open challenge. Although recent studies have leveraged powerful text-to-image models and MLLMs to assist graphic design, they typically simplify professional workflows, resulting in limited flexibility and intuitiveness. To address these limitations, we propose PSDesigner, an automated graphic design system that emulates the creative workflow of human designers. Building upon multiple specialized components, PSDesigner collects theme-related assets based on user instructions, and autonomously infers and executes tool calls to manipulate design files, such as integrating new assets or refining inferior elements. To endow the system with strong tool-use capabilities, we construct a design dataset, CreativePSD, which contains a large amount of high-quality PSD design files annotated with operation traces across a wide range of design scenarios and artistic styles, enabling models to learn expert design procedures. Extensive experiments demonstrate that PSDesigner outperforms existing methods across diverse graphic design tasks, empowering non-specialists to conveniently create production-quality designs.
- Abstract(参考訳): グラフィックデザインは創造的で革新的なプロセスであり、eコマースや広告といったアプリケーションにおいて重要な役割を果たす。
しかし、ユーザの意図を編集可能なデザインファイルに忠実に翻訳できる自動設計システムを開発することは、未解決の課題である。
近年の研究では、グラフィックデザインを支援するために強力なテキスト・ツー・イメージモデルとMLLMを活用しているが、通常はプロのワークフローを単純化し、柔軟性と直感性が制限されている。
これらの制約に対処するために,人間の創造的ワークフローをエミュレートしたグラフィックデザインシステムPSDesignerを提案する。
複数の特殊なコンポーネントに基づいて、PSDesignerはユーザー命令に基づいてテーマ関連資産を収集し、新しいアセットの統合や下位要素の精製といったデザインファイルを操作するツールコールを自律的に推論し実行する。
強力なツール利用能力を持つシステムを実現するために,多種多様なデザインシナリオや芸術スタイルの操作トレースを付加した大量の高品質なPSD設計ファイルを含む設計データセットCreativePSDを構築し,専門家による設計手順の学習を可能にする。
大規模な実験により、PSDesignerは様々なグラフィックデザインタスクにまたがって既存の手法よりも優れており、非スペシャリストがプロダクション品質の設計を便利に作成できるようにしている。
関連論文リスト
- CANVAS: A Benchmark for Vision-Language Models on Tool-Based User Interface Design [20.69770605071827]
本稿では,ツールベースのユーザインタフェース設計におけるVLMのベンチマークであるCANVASを紹介する。
私たちのベンチマークには,3.3KモバイルUI設計から採取した地平線参照と組み合わせた598のツールベースのデザインタスクが含まれています。
結果は、主要なモデルがより戦略的ツール呼び出しを示し、設計品質が向上することを示唆している。
論文 参考訳(メタデータ) (2025-11-25T16:13:20Z) - IGD: Instructional Graphic Design with Multimodal Layer Generation [83.31320209596991]
レイアウト生成に大きく依存する2段階の手法は創造性とインテリジェンスに欠けており、グラフィックデザインは依然として労働集約的である。
自然言語命令のみで編集可能な柔軟性を持つマルチモーダル層を高速に生成するインストラクショナルグラフィックデザイナ(IGD)を提案する。
論文 参考訳(メタデータ) (2025-07-14T04:31:15Z) - Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。
GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。
これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。
本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文 参考訳(メタデータ) (2025-07-08T02:26:08Z) - CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design [69.83433430133302]
CreatiDesignは、モデルアーキテクチャとデータセット構築の両方をカバーする、自動グラフィック設計のための体系的なソリューションである。
まず、異種設計要素の柔軟かつ正確な統合を可能にする統合されたマルチ条件駆動アーキテクチャを設計する。
さらに,各条件が指定された画像領域を正確に制御することを保証するため,マルチモーダルアテンションマスク機構を提案する。
論文 参考訳(メタデータ) (2025-05-25T12:14:23Z) - Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models [81.6240188672294]
グラフィックデザインでは、プロでないユーザは、限られたスキルとリソースのために視覚的に魅力的なレイアウトを作成するのに苦労することが多い。
レイアウト計画のための新しいマルチモーダル・インストラクション・フォロー・フレームワークを導入し、視覚的要素をカスタマイズしたレイアウトに簡単に配置できるようにする。
本手法は,非専門職の設計プロセスを単純化するだけでなく,数ショット GPT-4V モデルの性能を上回り,mIoU は Crello で 12% 向上する。
論文 参考訳(メタデータ) (2024-04-23T17:58:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。