論文の概要: LICA: Layered Image Composition Annotations for Graphic Design Research
- arxiv url: http://arxiv.org/abs/2603.16098v1
- Date: Tue, 17 Mar 2026 03:43:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.090831
- Title: LICA: Layered Image Composition Annotations for Graphic Design Research
- Title(参考訳): LICA:グラフィックデザイン研究のための階層画像合成アノテーション
- Authors: Elad Hirsch, Shubham Yadav, Mohit Garg, Purvanshi Mehta,
- Abstract要約: LICA (Layered Image composition s) は、1,550,244枚の多層グラフィックデザインの大規模データセットである。
データセットは20の設計カテゴリと991,850のユニークなテンプレートで構成され、現実世界のデザイン構造を幅広くカバーしている。
- 参考スコア(独自算出の注目度): 7.006851634670039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce LICA (Layered Image Composition Annotations), a large-scale dataset of 1,550,244 multi-layer graphic design compositions designed to advance structured understanding and generation of graphic layouts1. In addition to ren- dered PNG images, LICA represents each design as a hierarchical composition of typed components including text, image, vector, and group elements, each paired with rich per-element metadata such as spatial geometry, typographic attributes, opacity, and visibility. The dataset spans 20 design categories and 971,850 unique templates, providing broad coverage of real-world design structures. We further introduce graphic design video as a new and largely unexplored challenge for current vision-language models through 27,261 animated layouts annotated with per-component keyframes and motion parameters. Beyond scale, LICA establishes a new paradigm of research tasks for graphic design, enabling structured investiga- tions into problems such as layer-aware inpainting, structured layout generation, controlled design editing, and temporally-aware generative modeling. By repre- senting design as a system of compositional layers and relationships, the dataset supports research on models that operate directly on design structure rather than pixels alone.
- Abstract(参考訳): LICA(Layered Image composition Annotations)は、構造化された理解と図形レイアウトの生成を促進するために設計された1,550,244枚の多層グラフィックデザイン構成からなる大規模データセットである。
ren- dered PNG画像に加えて、LICAはテキスト、画像、ベクトル、グループ要素を含む型付きコンポーネントの階層的な構成として、それぞれに空間幾何学、タイポグラフィー属性、不透明度、可視性などのリッチな要素単位のメタデータをペアリングする。
データセットは20の設計カテゴリと991,850のユニークなテンプレートで構成され、現実世界のデザイン構造を幅広くカバーしている。
さらに我々は,従来の視覚言語モデルに対して,コンポーネントごとのキーフレームとモーションパラメータを付加した27,261のアニメーションレイアウトを通じて,新しい,ほとんど探索されていない新たな課題としてグラフィックデザインビデオを紹介した。
スケールを超えて、LICAはグラフィックデザインのための新しい研究課題のパラダイムを確立し、レイヤーアウェアの塗装、構造化レイアウト生成、制御されたデザイン編集、時間アウェアな生成モデリングといった問題に対する、構造化されたインペインティングを可能にする。
構成層と関係のシステムとしてデザインを再送することで、データセットはピクセルのみではなくデザイン構造を直接操作するモデルの研究をサポートする。
関連論文リスト
- IGD: Instructional Graphic Design with Multimodal Layer Generation [83.31320209596991]
レイアウト生成に大きく依存する2段階の手法は創造性とインテリジェンスに欠けており、グラフィックデザインは依然として労働集約的である。
自然言語命令のみで編集可能な柔軟性を持つマルチモーダル層を高速に生成するインストラクショナルグラフィックデザイナ(IGD)を提案する。
論文 参考訳(メタデータ) (2025-07-14T04:31:15Z) - Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。
GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。
これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。
本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文 参考訳(メタデータ) (2025-07-08T02:26:08Z) - CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design [69.83433430133302]
CreatiDesignは、モデルアーキテクチャとデータセット構築の両方をカバーする、自動グラフィック設計のための体系的なソリューションである。
まず、異種設計要素の柔軟かつ正確な統合を可能にする統合されたマルチ条件駆動アーキテクチャを設計する。
さらに,各条件が指定された画像領域を正確に制御することを保証するため,マルチモーダルアテンションマスク機構を提案する。
論文 参考訳(メタデータ) (2025-05-25T12:14:23Z) - From Elements to Design: A Layered Approach for Automatic Graphic Design Composition [16.262338090888342]
階層設計の原理をLMM(Large Multimodal Models)に導入する。
LaDeCoは与えられた要素セットに対してレイヤプランニングを行い、入力要素をその内容に応じて異なるセマンティックレイヤに分割する。
その後、設計構成を階層的に制御する要素属性を予測し、以前に生成されたレイヤのレンダリングイメージをコンテキストに含める。
論文 参考訳(メタデータ) (2024-12-27T16:13:08Z) - GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
本稿では,コンテンツ対応のテキストロゴレイアウトを生成するVLM(Vision-Language Model)ベースのフレームワークを提案する。
本稿では,複数のグリフ画像を同時に処理するための計算コストを削減する2つのモデル手法を提案する。
本モデルでは,既存の公開データセットの5倍の広義のテキストロゴデータセットを2つ構築する。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design [39.809852329070466]
本稿では,これらの課題に対処するために設計された階層型生成フレームワークであるCOLEシステムを紹介する。
このCOLEシステムは、曖昧な意図のプロンプトを高品質な多層グラフィック設計に変換すると同時に、ユーザ入力に基づく柔軟な編集をサポートする。
論文 参考訳(メタデータ) (2023-11-28T17:22:17Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - Composition-aware Graphic Layout GAN for Visual-textual Presentation
Designs [24.29890251913182]
与えられた画像に対して高品質な視覚テキスト提示設計を行う際のグラフィックレイアウト生成問題について検討する。
入力画像のグローバルおよび空間的視覚的内容に基づいてレイアウトを合成するために,合成対応グラフィックレイアウトGAN (CGL-GAN) と呼ばれる深層生成モデルを提案する。
論文 参考訳(メタデータ) (2022-04-30T16:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。