Fugu-MT 論文翻訳(概要): Evaluation Metrics for Automated Typographic Poster Generation

論文の概要: Evaluation Metrics for Automated Typographic Poster Generation

arxiv url: http://arxiv.org/abs/2402.06945v1
Date: Sat, 10 Feb 2024 13:18:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-13 18:31:56.830838
Title: Evaluation Metrics for Automated Typographic Poster Generation
Title（参考訳）: 自動タイポグラフィポスター生成のための評価指標
Authors: S\'ergio M. Rebelo, J. J. Merelo, Jo\~ao Bicker, Penousal Machado
Abstract要約: タイポグラフィー設計評価のための指標のセットを提案し,その妥当性に着目した。また、感情認識を統合して、テキストのセマンティクスを自動的に識別し、アプローチのパフォーマンスを解析する。
参考スコア（独自算出の注目度）: 0.24578723416255752
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Computational Design approaches facilitate the generation of typographic design, but evaluating these designs remains a challenging task. In this paper, we propose a set of heuristic metrics for typographic design evaluation, focusing on their legibility, which assesses the text visibility, aesthetics, which evaluates the visual quality of the design, and semantic features, which estimate how effectively the design conveys the content semantics. We experiment with a constrained evolutionary approach for generating typographic posters, incorporating the proposed evaluation metrics with varied setups, and treating the legibility metrics as constraints. We also integrate emotion recognition to identify text semantics automatically and analyse the performance of the approach and the visual characteristics outputs.
Abstract（参考訳）: 計算設計アプローチはタイポグラフィーデザインの生成を促進するが、これらの設計を評価することは難しい課題である。本稿では,テキストの可視性,デザインの視覚的品質を評価する美学,コンテンツ意味論を効果的に伝達する意味的特徴を評価できる,タイポグラフィーデザイン評価のためのヒューリスティックな指標のセットを提案する。我々は,タイポグラフィポスター生成のための制約付き進化的アプローチを試し,提案する評価指標を様々な設定に取り入れ,妥当性指標を制約として扱う。また、感情認識を統合してテキスト意味を自動識別し、そのアプローチの性能と視覚特性の分析を行う。

関連論文リスト

Towards More Accurate Personalized Image Generation: Addressing Overfitting and Evaluation Bias [52.590072198551944]
画像パーソナライズの目的は、ユーザが提供する課題に基づいて画像を作成することである。現在の手法では、テキストプロンプトへの忠実性を保証する上で、課題に直面している。トレーニング画像の歪みを除去するアトラクタを組み込んだ,新たなトレーニングパイプラインを導入する。
論文参考訳（メタデータ） (2025-03-09T14:14:02Z)
DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models [115.62816053600085]
デザインイメージをテキスト記述から合成するフレームワークであるDesignDiffusionを提案する。提案するフレームワークは,ユーザプロンプトから直接テキストおよびビジュアルデザイン要素を合成する。視覚テキストから派生した特徴的な文字埋め込みを利用して入力プロンプトを強化する。
論文参考訳（メタデータ） (2025-03-03T15:22:57Z)
Explaining Automatic Image Assessment [2.8084422332394428]
提案手法は、データセットのトレンドを可視化し、視覚的美的特徴を自動分類することで、美的評価モデルを説明する。既存のメトリクスと新しいメトリクスを使用して、各特定のモダリティに適応したモデルを評価することで、美的特徴とトレンドをキャプチャして視覚化することができる。
論文参考訳（メタデータ） (2025-02-03T22:55:14Z)
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.88536367177796]
そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。 PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。 PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文参考訳（メタデータ） (2025-01-07T16:53:01Z)
HMGIE: Hierarchical and Multi-Grained Inconsistency Evaluation for Vision-Language Data Cleansing [54.970275599061594]
我々は階層的・多階層的不整合評価(HMGIE)と呼ばれる適応的評価フレームワークを設計する。 HMGIEは、様々な画像キャプチャー対の精度と完全性の両方をカバーする多粒度評価を提供する。提案手法の有効性と柔軟性を検証するため,様々なタイプの画像キャプチャー・データセットであるMVTIDを構築した。
論文参考訳（メタデータ） (2024-12-07T15:47:49Z)
Design-o-meter: Towards Evaluating and Refining Graphic Designs [11.416650723712968]
本稿では,グラフィックデザインの良さを定量化するデータ駆動手法であるDesign-o-meterを紹介する。私たちの知る限りでは、Design-o-meterは統一されたフレームワークで設計をスコア付けし洗練する最初のアプローチです。
論文参考訳（メタデータ） (2024-11-22T14:17:46Z)
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models [39.06617653124486]
我々はTypeScoreと呼ばれる新しい評価フレームワークを導入し、モデルが高忠実な埋め込みテキストで画像を生成する能力を評価する。提案手法は、CLIPScoreよりも高解像度で、一般的な画像生成モデルを区別する。
論文参考訳（メタデータ） (2024-11-02T07:56:54Z)
signwriting-evaluation: Effective Sign Language Evaluation via SignWriting [3.484261625026626]
本稿では,SignWritingに特化して設計された評価指標を総合的に紹介する。シングルサインの評価と継続的署名の課題に対処する。以上の結果から,各指標の長所と短所が明らかとなり,今後の進歩に有意義な洞察が得られた。
論文参考訳（メタデータ） (2024-10-17T15:28:45Z)
KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities [93.74881034001312]
テキスト・画像生成モデルにおける実体の忠実度に関する系統的研究を行う。我々はランドマークの建物、航空機、植物、動物など、幅広い現実世界の視覚的実体を生成する能力に焦点をあてる。その結果、最も高度なテキスト・画像モデルでさえ、正確な視覚的詳細を持つエンティティを生成できないことが判明した。
論文参考訳（メタデータ） (2024-10-15T17:50:37Z)
MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.78359025027457]
MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文参考訳（メタデータ） (2024-06-28T11:58:26Z)
The Cognitive Type Project -- Mapping Typography to Cognition [1.0878040851638]
認知型プロジェクト(Cognitive Type Project)は、様々な認知特性を持つ書体の設計を可能にする計算ツールの開発に重点を置いている。このイニシアチブは、タイポグラファーに、オンライン広告のクリックスルー率を高め、児童書の読解レベルを改善し、ディプレクシックがパーソナライズされたタイプを作成するためのフォントを作成するよう促すことを目的としている。
論文参考訳（メタデータ） (2024-03-06T22:32:49Z)
Vision Language Model-based Caption Evaluation Method Leveraging Visual Context Extraction [27.00018283430169]
本稿では視覚言語モデルに基づくキャプション評価手法VisCE$2$を提案する。本手法は,オブジェクト,属性,関係性を含む画像の詳細な内容を参照する視覚的コンテキストに焦点をあてる。
論文参考訳（メタデータ） (2024-02-28T01:29:36Z)
X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance [70.08635216710967]
X-Meshはテキスト駆動型3Dスタイリングフレームワークで、新しいテキスト誘導動的注意モジュールを備えている。我々は、新しい標準テキストメシュベンチマーク、MIT-30と2つの自動メトリクスを導入し、将来の研究が公正で客観的な比較を達成できるようにする。
論文参考訳（メタデータ） (2023-03-28T06:45:31Z)
Patch-Prompt Aligned Bayesian Prompt Tuning for Vision-Language Models [48.77653835765705]
そこでは,まず下位分布から潜在ベクトルをサンプリングし,次に軽量な生成モデルを用いてラベル固有のプロンプトを階層的に生成する。提案手法の有効性は,少数ショット画像認識,ベース・ツー・ニュージェネリゼーション,データセット転送学習,ドメインシフトの4つのタスクで評価する。
論文参考訳（メタデータ） (2023-03-16T06:09:15Z)
Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文参考訳（メタデータ） (2021-11-08T17:16:38Z)
Matching Visual Features to Hierarchical Semantic Topics for Image Paragraph Captioning [50.08729005865331]
本稿では,階層的トピック誘導画像段落生成フレームワークを開発した。複数の抽象レベルでの画像とテキストの相関をキャプチャするために、変分推論ネットワークを設計します。段落生成を導くために、学習した階層的トピックと視覚的特徴を言語モデルに統合する。
論文参考訳（メタデータ） (2021-05-10T06:55:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。