論文の概要: NTIRE 2025 challenge on Text to Image Generation Model Quality Assessment
- arxiv url: http://arxiv.org/abs/2505.16314v1
- Date: Thu, 22 May 2025 07:12:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.110535
- Title: NTIRE 2025 challenge on Text to Image Generation Model Quality Assessment
- Title(参考訳): NTIRE 2025 テキストから画像生成モデル品質評価への挑戦
- Authors: Shuhao Han, Haotian Fan, Fangyuan Kong, Wenjie Liao, Chunle Guo, Chongyi Li, Radu Timofte, Liang Li, Tao Li, Junhui Cui, Yunqiu Wang, Yang Tai, Jingwei Sun, Jianhui Sun, Xinli Yue, Tianyi Wang, Huan Hou, Junda Lu, Xinyang Huang, Zitang Zhou, Zijian Zhang, Xuhui Zheng, Xuecheng Wu, Chong Peng, Xuezhi Cao, Trong-Hieu Nguyen-Mau, Minh-Hoang Le, Minh-Khoa Le-Phan, Duy-Nam Ly, Hai-Dang Nguyen, Minh-Triet Tran, Yukang Lin, Yan Hong, Chuanbiao Song, Siyuan Li, Jun Lan, Zhichao Zhang, Xinyue Li, Wei Sun, Zicheng Zhang, Yunhao Li, Xiaohong Liu, Guangtao Zhai, Zitong Xu, Huiyu Duan, Jiarui Wang, Guangji Ma, Liu Yang, Lu Liu, Qiang Hu, Xiongkuo Min, Zichuan Wang, Zhenchen Tang, Bo Peng, Jing Dong, Fengbin Guan, Zihao Yu, Yiting Lu, Wei Luo, Xin Li, Minhao Lin, Haofeng Chen, Xuanxuan He, Kele Xu, Qisheng Xu, Zijian Gao, Tianjiao Wan, Bo-Cheng Qiu, Chih-Chung Hsu, Chia-ming Lee, Yu-Fan Lin, Bo Yu, Zehao Wang, Da Mu, Mingxiu Chen, Junkang Fang, Huamei Sun, Wending Zhao, Zhiyu Wang, Wang Liu, Weikang Yu, Puhong Duan, Bin Sun, Xudong Kang, Shutao Li, Shuai He, Lingzhi Fu, Heng Cong, Rongyu Zhang, Jiarong He, Zhishan Qiao, Yongqing Huang, Zewen Chen, Zhe Pang, Juan Wang, Jian Guo, Zhizhuo Shao, Ziyu Feng, Bing Li, Weiming Hu, Hesong Li, Dehua Liu, Zeming Liu, Qingsong Xie, Ruichen Wang, Zhihao Li, Yuqi Liang, Jianqi Bi, Jun Luo, Junfeng Yang, Can Li, Jing Fu, Hongwei Xu, Mingrui Long, Lulin Tang,
- Abstract要約: 本稿では,テキスト・トゥ・イメージ(T2I)生成モデルの品質評価におけるNTIRE 2025課題について報告する。
この課題の目的は、テキスト・ツー・画像生成モデルのきめ細かい品質評価に対処することである。
- 参考スコア(独自算出の注目度): 146.76913448156176
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper reports on the NTIRE 2025 challenge on Text to Image (T2I) generation model quality assessment, which will be held in conjunction with the New Trends in Image Restoration and Enhancement Workshop (NTIRE) at CVPR 2025. The aim of this challenge is to address the fine-grained quality assessment of text-to-image generation models. This challenge evaluates text-to-image models from two aspects: image-text alignment and image structural distortion detection, and is divided into the alignment track and the structural track. The alignment track uses the EvalMuse-40K, which contains around 40K AI-Generated Images (AIGIs) generated by 20 popular generative models. The alignment track has a total of 371 registered participants. A total of 1,883 submissions are received in the development phase, and 507 submissions are received in the test phase. Finally, 12 participating teams submitted their models and fact sheets. The structure track uses the EvalMuse-Structure, which contains 10,000 AI-Generated Images (AIGIs) with corresponding structural distortion mask. A total of 211 participants have registered in the structure track. A total of 1155 submissions are received in the development phase, and 487 submissions are received in the test phase. Finally, 8 participating teams submitted their models and fact sheets. Almost all methods have achieved better results than baseline methods, and the winning methods in both tracks have demonstrated superior prediction performance on T2I model quality assessment.
- Abstract(参考訳): 本報告では, CVPR 2025におけるテキスト・トゥ・イメージ(T2I)生成モデルの品質評価に関するNTIRE 2025の課題について報告する。
この課題の目的は、テキスト・ツー・画像生成モデルのきめ細かい品質評価に対処することである。
この課題は、画像テキストアライメントと画像構造歪み検出という2つの側面からテキスト・ツー・イメージ・モデルを評価し、アライメント・トラックと構造トラックに分割する。
アライメントトラックはEvalMuse-40Kを使用しており、20の一般的な生成モデルによって生成される約40KのAIGIを含んでいる。
アライメントトラックには合計371人の登録参加者がいる。
開発段階では合計1,883件の提出を受け、テスト段階では507件の提出を受ける。
最後に、12の参加チームがモデルとファクトシートを提出した。
構造トラックはEvalMuse-Structureを使用しており、1万のAI生成画像(AIGI)とそれに対応する構造歪みマスクを含んでいる。
合計で211人が登録されている。
開発段階では合計1155件の提出を受け、試験段階では487件の提出を受ける。
最終的に8チームがモデルとファクトシートを提出した。
ほぼすべての手法がベースライン法よりも優れた結果を得ており、両トラックの勝利法はT2Iモデルの品質評価において優れた予測性能を示した。
関連論文リスト
- NTIRE 2025 Challenge on Image Super-Resolution ($\times$4): Methods and Results [159.15538432295656]
NTIRE 2025イメージ超解像(4ドル)チャレンジは、CVPR 2025の第10回NETREワークショップのコンペティションのひとつ。
この課題は、低分解能(LR)画像から高分解能(HR)画像を復元することを目的としている。
286人の参加者が参加し、25チームが有効なエントリーを提出した。
論文 参考訳(メタデータ) (2025-04-20T12:08:22Z) - NTIRE 2024 Quality Assessment of AI-Generated Content Challenge [141.37864527005226]
課題は、イメージトラックとビデオトラックに分けられる。
両トラックの勝利法はAIGCの予測性能に優れていた。
論文 参考訳(メタデータ) (2024-04-25T15:36:18Z) - NTIRE 2021 Challenge on Perceptual Image Quality Assessment [128.83256694901726]
NTIRE 2021の知覚画像品質評価(IQA)に関する課題について報告する。
CVPR 2021では、画像修復・強化ワークショップ(NTIRE)のNew Trendsと連携して開催されました。
新しいタイプの画像処理技術として、GAN(Generative Adversarial Networks)に基づく知覚画像処理アルゴリズムが、より現実的なテクスチャを持つ画像を生成する。
論文 参考訳(メタデータ) (2021-05-07T05:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。