論文の概要: T2I-ReasonBench: Benchmarking Reasoning-Informed Text-to-Image Generation
- arxiv url: http://arxiv.org/abs/2508.17472v1
- Date: Sun, 24 Aug 2025 17:59:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.545978
- Title: T2I-ReasonBench: Benchmarking Reasoning-Informed Text-to-Image Generation
- Title(参考訳): T2I-ReasonBench: テキスト・ツー・イメージ生成のベンチマーク
- Authors: Kaiyue Sun, Rongyao Fang, Chengqi Duan, Xian Liu, Xihui Liu,
- Abstract要約: テキスト・ツー・イメージ(T2I)モデルの推論能力を評価するベンチマークであるT2I-ReasonBenchを提案する。
テクスチュアル・イメージ・デザイン、エンティティ・推論、科学・推論の4つの側面で構成されている。
- 参考スコア(独自算出の注目度): 41.3139483775936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose T2I-ReasonBench, a benchmark evaluating reasoning capabilities of text-to-image (T2I) models. It consists of four dimensions: Idiom Interpretation, Textual Image Design, Entity-Reasoning and Scientific-Reasoning. We propose a two-stage evaluation protocol to assess the reasoning accuracy and image quality. We benchmark various T2I generation models, and provide comprehensive analysis on their performances.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)モデルの推論能力を評価するベンチマークであるT2I-ReasonBenchを提案する。
Idiom Interpretation、Textual Image Design、Entity-Reasoning、Scientific-Reasoningの4つの次元で構成されている。
推論精度と画像品質を評価するための2段階評価プロトコルを提案する。
我々は,様々なT2I生成モデルをベンチマークし,その性能を総合的に分析する。
関連論文リスト
- OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation [23.05106664412349]
テキスト・ツー・イメージ(T2I)モデルは、テキスト・プロンプトに整合した高品質な画像を生成する上で大きな注目を集めている。
OneIG-Benchは、T2Iモデルを複数の次元で評価するためのベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-06-09T17:50:21Z) - TIIF-Bench: How Does Your T2I Model Follow Your Instructions? [7.13169573900556]
本稿では, TIIF-Bench (Text-to-Image Instruction following Benchmark) を提案する。
TIIF-Benchは、複数の次元に沿って組織された5000のプロンプトから構成されており、難易度と複雑さの3つのレベルに分類される。
T2Iモデルのテキスト合成精度と美的コヒーレンスを評価するために,テキストレンダリングとスタイル制御という2つの重要な属性が導入された。
論文 参考訳(メタデータ) (2025-06-02T18:44:07Z) - R2I-Bench: Benchmarking Reasoning-Driven Text-to-Image Generation [26.816674696050413]
推論は、現実世界のテキスト・ツー・イメージ(T2I)生成に必要な基本的な機能である。
最近のT2Iモデルでは、フォトリアリスティックな画像の生成が著しく進歩しているが、その推論能力はまだ未開発である。
推論駆動型T2I生成を厳格に評価するベンチマークであるR2I-Benchを紹介する。
論文 参考訳(メタデータ) (2025-05-29T14:43:46Z) - PhyBench: A Physical Commonsense Benchmark for Evaluating Text-to-Image Models [50.33699462106502]
テキスト・トゥ・イメージ(T2I)モデルは、物理コモンセンスと整合した画像を生成するのにしばしば失敗する。
現在のT2I評価ベンチマークは、精度、バイアス、安全性などの指標に焦点を当て、モデルの内部知識の評価を無視している。
メカニクス,光学,熱力学,材料特性の4つのカテゴリに700のプロンプトを含む総合的なT2I評価データセットであるPhyBenchを紹介する。
論文 参考訳(メタデータ) (2024-06-17T17:49:01Z) - A Contrastive Compositional Benchmark for Text-to-Image Synthesis: A
Study with Unified Text-to-Image Fidelity Metrics [58.83242220266935]
我々は,T2Iモデルの構成性を評価するためのベンチマークであるWinoground-T2Iを紹介する。
このベンチマークには、20のカテゴリにまたがる11Kの複雑で高品質なコントラスト文ペアが含まれている。
我々は、Winoground-T2Iモデルの性能評価と、その評価に使用される指標の2つの目的を兼ね備えたWinoground-T2Iを用いている。
論文 参考訳(メタデータ) (2023-12-04T20:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。