論文の概要: Evaluation Metrics for Automated Typographic Poster Generation
- arxiv url: http://arxiv.org/abs/2402.06945v1
- Date: Sat, 10 Feb 2024 13:18:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 18:31:56.830838
- Title: Evaluation Metrics for Automated Typographic Poster Generation
- Title(参考訳): 自動タイポグラフィポスター生成のための評価指標
- Authors: S\'ergio M. Rebelo, J. J. Merelo, Jo\~ao Bicker, Penousal Machado
- Abstract要約: タイポグラフィー設計評価のための指標のセットを提案し,その妥当性に着目した。
また、感情認識を統合して、テキストのセマンティクスを自動的に識別し、アプローチのパフォーマンスを解析する。
- 参考スコア(独自算出の注目度): 0.24578723416255752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational Design approaches facilitate the generation of typographic
design, but evaluating these designs remains a challenging task. In this paper,
we propose a set of heuristic metrics for typographic design evaluation,
focusing on their legibility, which assesses the text visibility, aesthetics,
which evaluates the visual quality of the design, and semantic features, which
estimate how effectively the design conveys the content semantics. We
experiment with a constrained evolutionary approach for generating typographic
posters, incorporating the proposed evaluation metrics with varied setups, and
treating the legibility metrics as constraints. We also integrate emotion
recognition to identify text semantics automatically and analyse the
performance of the approach and the visual characteristics outputs.
- Abstract(参考訳): 計算設計アプローチはタイポグラフィーデザインの生成を促進するが、これらの設計を評価することは難しい課題である。
本稿では,テキストの可視性,デザインの視覚的品質を評価する美学,コンテンツ意味論を効果的に伝達する意味的特徴を評価できる,タイポグラフィーデザイン評価のためのヒューリスティックな指標のセットを提案する。
我々は,タイポグラフィポスター生成のための制約付き進化的アプローチを試し,提案する評価指標を様々な設定に取り入れ,妥当性指標を制約として扱う。
また、感情認識を統合してテキスト意味を自動識別し、そのアプローチの性能と視覚特性の分析を行う。
関連論文リスト
- Explaining Automatic Image Assessment [2.8084422332394428]
提案手法は、データセットのトレンドを可視化し、視覚的美的特徴を自動分類することで、美的評価モデルを説明する。
既存のメトリクスと新しいメトリクスを使用して、各特定のモダリティに適応したモデルを評価することで、美的特徴とトレンドをキャプチャして視覚化することができる。
論文 参考訳(メタデータ) (2025-02-03T22:55:14Z) - PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.88536367177796]
そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。
PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。
PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2025-01-07T16:53:01Z) - HMGIE: Hierarchical and Multi-Grained Inconsistency Evaluation for Vision-Language Data Cleansing [54.970275599061594]
我々は階層的・多階層的不整合評価(HMGIE)と呼ばれる適応的評価フレームワークを設計する。
HMGIEは、様々な画像キャプチャー対の精度と完全性の両方をカバーする多粒度評価を提供する。
提案手法の有効性と柔軟性を検証するため,様々なタイプの画像キャプチャー・データセットであるMVTIDを構築した。
論文 参考訳(メタデータ) (2024-12-07T15:47:49Z) - Design-o-meter: Towards Evaluating and Refining Graphic Designs [11.416650723712968]
本稿では,グラフィックデザインの良さを定量化するデータ駆動手法であるDesign-o-meterを紹介する。
私たちの知る限りでは、Design-o-meterは統一されたフレームワークで設計をスコア付けし洗練する最初のアプローチです。
論文 参考訳(メタデータ) (2024-11-22T14:17:46Z) - TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models [39.06617653124486]
我々はTypeScoreと呼ばれる新しい評価フレームワークを導入し、モデルが高忠実な埋め込みテキストで画像を生成する能力を評価する。
提案手法は、CLIPScoreよりも高解像度で、一般的な画像生成モデルを区別する。
論文 参考訳(メタデータ) (2024-11-02T07:56:54Z) - KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities [93.74881034001312]
テキスト・画像生成モデルにおける実体の忠実度に関する系統的研究を行う。
我々はランドマークの建物、航空機、植物、動物など、幅広い現実世界の視覚的実体を生成する能力に焦点をあてる。
その結果、最も高度なテキスト・画像モデルでさえ、正確な視覚的詳細を持つエンティティを生成できないことが判明した。
論文 参考訳(メタデータ) (2024-10-15T17:50:37Z) - MetaDesigner: Advancing Artistic Typography Through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerがLarge Language Models(LLM)を利用したアートタイポグラフィーのための変換フレームワークを導入
その基盤は、Pipeline、Glyph、Textureエージェントで構成されるマルチエージェントシステムであり、カスタマイズ可能なWordArtの作成をまとめてオーケストレーションしている。
論文 参考訳(メタデータ) (2024-06-28T11:58:26Z) - The Cognitive Type Project -- Mapping Typography to Cognition [1.0878040851638]
認知型プロジェクト(Cognitive Type Project)は、様々な認知特性を持つ書体の設計を可能にする計算ツールの開発に重点を置いている。
このイニシアチブは、タイポグラファーに、オンライン広告のクリックスルー率を高め、児童書の読解レベルを改善し、ディプレクシックがパーソナライズされたタイプを作成するためのフォントを作成するよう促すことを目的としている。
論文 参考訳(メタデータ) (2024-03-06T22:32:49Z) - Vision Language Model-based Caption Evaluation Method Leveraging Visual
Context Extraction [27.00018283430169]
本稿では視覚言語モデルに基づくキャプション評価手法VisCE$2$を提案する。
本手法は,オブジェクト,属性,関係性を含む画像の詳細な内容を参照する視覚的コンテキストに焦点をあてる。
論文 参考訳(メタデータ) (2024-02-28T01:29:36Z) - X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic
Textual Guidance [70.08635216710967]
X-Meshはテキスト駆動型3Dスタイリングフレームワークで、新しいテキスト誘導動的注意モジュールを備えている。
我々は、新しい標準テキストメシュベンチマーク、MIT-30と2つの自動メトリクスを導入し、将来の研究が公正で客観的な比較を達成できるようにする。
論文 参考訳(メタデータ) (2023-03-28T06:45:31Z) - Matching Visual Features to Hierarchical Semantic Topics for Image
Paragraph Captioning [50.08729005865331]
本稿では,階層的トピック誘導画像段落生成フレームワークを開発した。
複数の抽象レベルでの画像とテキストの相関をキャプチャするために、変分推論ネットワークを設計します。
段落生成を導くために、学習した階層的トピックと視覚的特徴を言語モデルに統合する。
論文 参考訳(メタデータ) (2021-05-10T06:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。