論文の概要: PRISM: Learning Design Knowledge from Data for Stylistic Design Improvement
- arxiv url: http://arxiv.org/abs/2601.11747v1
- Date: Fri, 16 Jan 2026 19:56:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.309365
- Title: PRISM: Learning Design Knowledge from Data for Stylistic Design Improvement
- Title(参考訳): PRISM:データから設計知識を学習して立体設計を改善する
- Authors: Huaxiaoyue Wang, Sunav Choudhary, Franck Dernoncourt, Yu Shen, Stefano Petrangeli,
- Abstract要約: 設計知識ベースを3段階に構築し,適用するPRISMを提案する。
PRior-Informed Stylistic Modificationは、スタイルアライメントにおいて、ベースラインよりも1.49の平均的なランクを達成している。
- 参考スコア(独自算出の注目度): 41.781073117624054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graphic design often involves exploring different stylistic directions, which can be time-consuming for non-experts. We address this problem of stylistically improving designs based on natural language instructions. While VLMs have shown initial success in graphic design, their pretrained knowledge on styles is often too general and misaligned with specific domain data. For example, VLMs may associate minimalism with abstract designs, whereas designers emphasize shape and color choices. Our key insight is to leverage design data -- a collection of real-world designs that implicitly capture designer's principles -- to learn design knowledge and guide stylistic improvement. We propose PRISM (PRior-Informed Stylistic Modification) that constructs and applies a design knowledge base through three stages: (1) clustering high-variance designs to capture diversity within a style, (2) summarizing each cluster into actionable design knowledge, and (3) retrieving relevant knowledge during inference to enable style-aware improvement. Experiments on the Crello dataset show that PRISM achieves the highest average rank of 1.49 (closer to 1 is better) over baselines in style alignment. User studies further validate these results, showing that PRISM is consistently preferred by designers.
- Abstract(参考訳): グラフィックデザインは、しばしば異なるスタイルの方向を探索する。
自然言語命令に基づく設計をスタイリスティックに改善するこの問題に対処する。
VLMはグラフィックデザインで最初の成功をおさめたが、それらのスタイルに関する事前訓練された知識は、しばしばあまりにも一般的であり、特定のドメインデータと不一致である。
例えば、VLMはミニマリズムと抽象デザインを関連付けるが、デザイナは形状と色の選択を強調する。
私たちの重要な洞察は、設計知識を学習し、スタイル改善を導くために、設計データ(設計者の原則を暗黙的に捉えた現実世界の設計の集合)を活用することです。
提案するPRISM(PRior-Informed Stylistic Modification)は,(1)スタイル内の多様性を捉えるために高分散設計をクラスタリングし,(2)各クラスタを動作可能な設計知識に要約し,(3)推論中に関連する知識を抽出してスタイル認識の改善を実現する,という3つの段階を通じて設計知識ベースを構築し,適用する。
Crelloデータセットの実験では、PRISMはスタイルアライメントにおけるベースラインよりも1.49(クローズから1の方が良い)の平均ランクを達成している。
ユーザスタディはこれらの結果をさらに検証し、PRISMがデザイナーによって一貫して好まれていることを示す。
関連論文リスト
- DesignPref: Capturing Personal Preferences in Visual Design Generation [19.015205942741837]
20人のプロデザイナーが注釈付けしたUIデザイン生成の12k対比較データセットであるDesignPrefを紹介した。
パーソナライズされたモデルは、個々のデザイナの好みを予測するために、集約されたベースラインモデルよりも一貫して優れていることを示す。
我々の研究は、パーソナライズされたビジュアルデザイン評価を研究する最初のデータセットを提供し、個人デザインの味をモデル化する将来の研究を支援する。
論文 参考訳(メタデータ) (2025-11-25T17:19:10Z) - Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。
GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。
これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。
本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文 参考訳(メタデータ) (2025-07-08T02:26:08Z) - FedGAI: Federated Style Learning with Cloud-Edge Collaboration for Generative AI in Fashion Design [6.141395195643172]
本稿では,Federated Generative Artificial Intelligence Clothingシステム,すなわちFedGAIを紹介する。
FedGAIは、デザイナーがスケッチスタイルを交換できるエコシステムを確立することを約束している。
当社のFedGAIシステムでは,人間設計のスケッチに匹敵する品質のマルチスタイルスケッチを作成できる。
論文 参考訳(メタデータ) (2025-03-16T07:31:25Z) - GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
本稿では,コンテンツ対応のテキストロゴレイアウトを生成するVLM(Vision-Language Model)ベースのフレームワークを提案する。
本稿では,複数のグリフ画像を同時に処理するための計算コストを削減する2つのモデル手法を提案する。
本モデルでは,既存の公開データセットの5倍の広義のテキストロゴデータセットを2つ構築する。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models [81.6240188672294]
グラフィックデザインでは、プロでないユーザは、限られたスキルとリソースのために視覚的に魅力的なレイアウトを作成するのに苦労することが多い。
レイアウト計画のための新しいマルチモーダル・インストラクション・フォロー・フレームワークを導入し、視覚的要素をカスタマイズしたレイアウトに簡単に配置できるようにする。
本手法は,非専門職の設計プロセスを単純化するだけでなく,数ショット GPT-4V モデルの性能を上回り,mIoU は Crello で 12% 向上する。
論文 参考訳(メタデータ) (2024-04-23T17:58:33Z) - DesignProbe: A Graphic Design Benchmark for Multimodal Large Language Models [35.10231741092462]
精巧なグラフィックデザインは、きめ細かいデザイン要素(色、フォント、レイアウト)から全体的なデザインまで、2段階の調和を実現するのが一般的である。
MLLM(Multimodal Large Language Models)の急速な開発に伴い,設計におけるMLLMの能力を調べるためのベンチマークであるDesignProbeを確立する。
論文 参考訳(メタデータ) (2024-04-23T07:31:19Z) - Efficient Automatic Machine Learning via Design Graphs [72.85976749396745]
最適なモデル設計を探索する効率的なサンプルベース手法であるFALCONを提案する。
FALCONは,1)グラフニューラルネットワーク(GNN)を介してデザイングラフ上でメッセージパッシングを行うタスク非依存モジュール,2)既知のモデル性能情報のラベル伝搬を行うタスク固有モジュールを特徴とする。
FALCONは,30個の探索ノードのみを用いて,各タスクに対して良好な性能を持つ設計を効率的に得ることを実証的に示す。
論文 参考訳(メタデータ) (2022-10-21T21:25:59Z) - Material Prediction for Design Automation Using Graph Representation
Learning [5.181429907321226]
本稿では,集合体の物質予測を支援するグラフ表現学習フレームワークを提案する。
CADモデルの集合グラフ表現上でのノードレベルの予測タスクとして材料選択タスクを定式化し、グラフニューラルネットワーク(GNN)を用いてそれに取り組む。
提案するフレームワークは,大規模データセットにスケールアップし,デザイナの知識を学習プロセスに組み込む。
論文 参考訳(メタデータ) (2022-09-26T15:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。