論文の概要: ServImage: An Image Generation and Editing Benchmark from Real-world Commercial Imaging Services
- arxiv url: http://arxiv.org/abs/2604.24023v1
- Date: Mon, 27 Apr 2026 04:11:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.733088
- Title: ServImage: An Image Generation and Editing Benchmark from Real-world Commercial Imaging Services
- Title(参考訳): ServImage: リアルタイムの商用画像サービスによる画像生成と編集ベンチマーク
- Authors: Fengxian Ji, Jingpu Yang, Zirui Song, Lang Gao, Junhong Liang, Zhenhao Chen, Jinghui Zhang, Xiuying Chen,
- Abstract要約: textbfServImageは、商業設計プロジェクトにおいて、モデル出力と経済的価値を明示的に関連付けるベンチマークである。
ServImageは、(i) textbftextitServImageBench: 1.07kの有償商用デザインタスクと2.05kのデザイナ向けデザイナ向けデータセットで構成され、合計で295k以上の画像、製品、デジタルコンテンツ、33kの候補画像、33kの人間のアノテーションで構成されている。
textbftextitServImageModel:このスコアリングシステムの下で、人間アノテーションに基づいて訓練された支払予測モデルを提案する。
- 参考スコア(独自算出の注目度): 20.283096576678933
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent image generation and editing models demonstrate robust adherence to instructions and high visual quality on academic benchmarks. However, their performance on paid, real-world design projects remains uncertain. We introduce \textbf{ServImage}, a benchmark that explicitly correlates model outputs with economic value in commercial design projects. ServImage consists of (i) \textbf{\textit{ServImageBench}}: a dataset of 1.07k paid commercial design tasks and 2.05k designer deliverables totaling over \$295k, covering portrait, product, and digital content, along with 33k candidate images and 33k human annotations. (ii) \textbf{\textit{ServImageScore}}: an integrated scoring system that combines three quality dimensions: baseline requirements fulfilment, visual execution quality, and commercial necessity satisfaction. These three dimensions are designed to characterize the factors that drive human payment decisions and indicate whether an image is commercially acceptable. (iii) \textbf{\textit{ServImageModel}}: under this scoring system, we propose a payment prediction model trained on the human-annotated candidate images, achieving 82.00\% accuracy in predicting human payment decisions and producing calibrated payment probabilities. ServImage provides a comprehensive foundation for assessing the commercial viability of image generation models and offers a scalable resource for future research on economically grounded vision systems \href{https://github.com/FengxianJi/ServImage}{Github.}
- Abstract(参考訳): 最近の画像生成・編集モデルは, 学術ベンチマークにおいて, 指示への頑健な執着と高い視覚的品質を示す。
しかし、彼らの有償の現実世界の設計プロジェクトにおけるパフォーマンスは、いまだに不確実である。
本稿では, 商業設計プロジェクトにおいて, モデル出力と経済的価値を明示的に相関させるベンチマークである \textbf{ServImage} を紹介する。
ServImage は
(i) \textbf{\textit{ServImageBench}}: 1.07kの有償の商用デザインタスクと2.05kのデザイナによる合計295k以上の製品、デジタルコンテンツ、33kの候補画像、33kの人間のアノテーションのデータセット。
(ii) \textbf{\textit{ServImageScore}}: ベースライン要求満足度、視覚的実行品質、商業的必要満足度という3つの品質次元を組み合わせた統合スコアシステム。
これらの3次元は、人間の支払い決定を駆動する要因を特徴づけ、画像が商業的に受け入れられているかどうかを示すように設計されている。
(iii) \textbf{\textit{ServImageModel}}:このスコアリングシステムでは、人手による候補画像に基づいて訓練された支払予測モデルを提案し、人手による支払決定の精度82.00\%、キャリブレーションされた支払確率を推定する。
ServImageは、画像生成モデルの商業的生存性を評価するための総合的な基盤を提供し、経済的基盤を持つビジョンシステム \href{https://github.com/FengxianJi/ServImage}{Github に関する将来の研究のためのスケーラブルなリソースを提供する。
※
関連論文リスト
- BizGenEval: A Systematic Benchmark for Commercial Visual Content Generation [96.52958279106777]
BizGenEvalは、商用のビジュアルコンテンツ生成のための体系的なベンチマークである。
BizGenEvalには400の慎重にキュレートされたプロンプトと8000の人間検証チェックリスト質問が含まれている。
その結果、現在の生成モデルとプロのビジュアルコンテンツ作成の要件との間には、かなりの能力ギャップが明らかとなった。
論文 参考訳(メタデータ) (2026-03-26T17:59:16Z) - From Prompt to Production:Automating Brand-Safe Marketing Imagery with Text-to-Image Models [3.751381767989883]
本稿では,テキスト・ツー・イメージ・モデルを用いて商用製品のマーケティングイメージを生成するための,完全自動化されたスケーラブルなソリューションを提供するパイプラインを提案する。
提案システムは,画像の品質と忠実さを維持しつつ,マーケティングガイドラインに準拠した十分な創造的バリエーションを導入している。
論文 参考訳(メタデータ) (2026-02-12T21:35:21Z) - Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer [38.99742258165009]
Z-Imageは、"スケール・アット・オール・コスト"パラダイムに挑戦する効率的な基礎生成モデルである。
我々のモデルは、様々な分野において主要な競合相手に匹敵する、またはそれを上回るパフォーマンスを達成する。
当社のコード、ウェイト、オンラインデモを公開し、予算に優しい、最先端のジェネレーティブモデルの開発を奨励しています。
論文 参考訳(メタデータ) (2025-11-27T18:52:07Z) - Q-REAL: Towards Realism and Plausibility Evaluation for AI-Generated Content [71.46991494014382]
本稿では,AI生成画像におけるリアリズムと妥当性の詳細な評価のための新しいデータセットであるQ-Realを紹介する。
Q-Realは、人気のあるテキスト・ツー・イメージ・モデルによって生成される3,088のイメージで構成されている。
そこで本研究では,Q-Real Benchを2つの課題,すなわち判断と推論による根拠付けに基づいて評価する。
論文 参考訳(メタデータ) (2025-11-21T02:43:17Z) - ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing [23.512687688393346]
ICE-Benchは、画像生成モデルを厳格に評価するために設計された包括的なベンチマークである。
評価フレームワークは、6次元にわたる画像生成能力を評価する。
既存の世代モデルを徹底的に分析し、ベンチマークの難易度と現在のモデル能力と実世界の世代要件のギャップを明らかにする。
論文 参考訳(メタデータ) (2025-03-18T17:53:29Z) - ImagenHub: Standardizing the evaluation of conditional image generation
models [48.51117156168]
本稿では,条件付き画像生成モデルの推論と評価を標準化するワンストップライブラリであるImagenHubを提案する。
本研究では,感性一貫性と知覚品質という2つの評価スコアと,生成した画像を評価するための包括的なガイドラインを設計する。
人間の評価は,0.4以上の値を持つ76%のモデル上で,クリッペンドルフのαに対する高い労働者間合意を達成する。
論文 参考訳(メタデータ) (2023-10-02T19:41:42Z) - Emu: Enhancing Image Generation Models Using Photogenic Needles in a
Haystack [75.00066365801993]
Webスケールの画像-テキストペアによるテキスト-画像モデルのトレーニングにより、テキストから幅広い視覚概念を生成することができる。
これらの事前訓練されたモデルは、高度に美的な画像を生成することに関して、しばしば課題に直面します。
本稿では,高度に視覚的に魅力的な画像のみを生成するために,事前学習されたモデルを誘導する品質チューニングを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。