論文の概要: Evaluation Metrics for Automated Typographic Poster Generation
- arxiv url: http://arxiv.org/abs/2402.06945v1
- Date: Sat, 10 Feb 2024 13:18:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 18:31:56.830838
- Title: Evaluation Metrics for Automated Typographic Poster Generation
- Title(参考訳): 自動タイポグラフィポスター生成のための評価指標
- Authors: S\'ergio M. Rebelo, J. J. Merelo, Jo\~ao Bicker, Penousal Machado
- Abstract要約: タイポグラフィー設計評価のための指標のセットを提案し,その妥当性に着目した。
また、感情認識を統合して、テキストのセマンティクスを自動的に識別し、アプローチのパフォーマンスを解析する。
- 参考スコア(独自算出の注目度): 0.24578723416255752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational Design approaches facilitate the generation of typographic
design, but evaluating these designs remains a challenging task. In this paper,
we propose a set of heuristic metrics for typographic design evaluation,
focusing on their legibility, which assesses the text visibility, aesthetics,
which evaluates the visual quality of the design, and semantic features, which
estimate how effectively the design conveys the content semantics. We
experiment with a constrained evolutionary approach for generating typographic
posters, incorporating the proposed evaluation metrics with varied setups, and
treating the legibility metrics as constraints. We also integrate emotion
recognition to identify text semantics automatically and analyse the
performance of the approach and the visual characteristics outputs.
- Abstract(参考訳): 計算設計アプローチはタイポグラフィーデザインの生成を促進するが、これらの設計を評価することは難しい課題である。
本稿では,テキストの可視性,デザインの視覚的品質を評価する美学,コンテンツ意味論を効果的に伝達する意味的特徴を評価できる,タイポグラフィーデザイン評価のためのヒューリスティックな指標のセットを提案する。
我々は,タイポグラフィポスター生成のための制約付き進化的アプローチを試し,提案する評価指標を様々な設定に取り入れ,妥当性指標を制約として扱う。
また、感情認識を統合してテキスト意味を自動識別し、そのアプローチの性能と視覚特性の分析を行う。
関連論文リスト
- Can AI Models Appreciate Document Aesthetics? An Exploration of Legibility and Layout Quality in Relation to Prediction Confidence [3.049887057143419]
十分に設計された文書は、その言葉だけでなく、その視覚的雄弁性を通してもコミュニケーションする。
著者は、色、フォント、グラフィック、レイアウトなどの美的要素を使って情報の知覚を形作る。
最先端のドキュメントAIモデルはレイアウトと画像データを組み込むことの利点を示しているが、文書美学のニュアンスを効果的に捉えているかどうかは不明だ。
論文 参考訳(メタデータ) (2024-03-27T01:21:48Z) - Evaluating Text-to-Image Synthesis: Survey and Taxonomy of Image Quality Metrics [9.753473063305503]
本稿では,既存のテキスト・画像評価指標について概観する。
これらの指標を分類するための新しい分類法を提案する。
我々は,テキスト・ツー・イメージ評価を行う実践者のためのガイドラインを導出し,評価メカニズムのオープンな課題と,現在の指標の限界について論じる。
論文 参考訳(メタデータ) (2024-03-18T14:24:20Z) - The Cognitive Type Project -- Mapping Typography to Cognition [1.0878040851638]
認知型プロジェクト(Cognitive Type Project)は、様々な認知特性を持つ書体の設計を可能にする計算ツールの開発に重点を置いている。
このイニシアチブは、タイポグラファーに、オンライン広告のクリックスルー率を高め、児童書の読解レベルを改善し、ディプレクシックがパーソナライズされたタイプを作成するためのフォントを作成するよう促すことを目的としている。
論文 参考訳(メタデータ) (2024-03-06T22:32:49Z) - Vision Language Model-based Caption Evaluation Method Leveraging Visual
Context Extraction [27.00018283430169]
本稿では視覚言語モデルに基づくキャプション評価手法VisCE$2$を提案する。
本手法は,オブジェクト,属性,関係性を含む画像の詳細な内容を参照する視覚的コンテキストに焦点をあてる。
論文 参考訳(メタデータ) (2024-02-28T01:29:36Z) - Evaluating Large Language Model Creativity from a Literary Perspective [13.672268920902187]
本稿では,大規模言語モデルが創造的記述プロセスにおいて補助ツールとして機能する可能性を評価する。
我々は,背景記述をインターリーブする対話的かつ多声的なプロンプト戦略,構成を案内する指示,対象スタイルのテキストのサンプル,与えられたサンプルの批判的議論を開発する。
論文 参考訳(メタデータ) (2023-11-30T16:46:25Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - Benchmarking Zero-Shot Recognition with Vision-Language Models:
Challenges on Granularity and Specificity [47.59279298300943]
本稿では、実世界のゼロショット認識タスクにおいて、視覚言語モデル(VLM)を評価するための革新的なベンチマークを紹介する。
本研究では,画像ネットとMS-COCOデータセットを用いて,概念の粒度レベルでの認識におけるモデルの一貫性を評価する。
論文 参考訳(メタデータ) (2023-06-28T09:29:06Z) - X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic
Textual Guidance [70.08635216710967]
X-Meshはテキスト駆動型3Dスタイリングフレームワークで、新しいテキスト誘導動的注意モジュールを備えている。
我々は、新しい標準テキストメシュベンチマーク、MIT-30と2つの自動メトリクスを導入し、将来の研究が公正で客観的な比較を達成できるようにする。
論文 参考訳(メタデータ) (2023-03-28T06:45:31Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文 参考訳(メタデータ) (2021-11-08T17:16:38Z) - Matching Visual Features to Hierarchical Semantic Topics for Image
Paragraph Captioning [50.08729005865331]
本稿では,階層的トピック誘導画像段落生成フレームワークを開発した。
複数の抽象レベルでの画像とテキストの相関をキャプチャするために、変分推論ネットワークを設計します。
段落生成を導くために、学習した階層的トピックと視覚的特徴を言語モデルに統合する。
論文 参考訳(メタデータ) (2021-05-10T06:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。