論文の概要: NTIRE 2026 The 3rd Restore Any Image Model (RAIM) Challenge: Professional Image Quality Assessment (Track 1)
- arxiv url: http://arxiv.org/abs/2604.12512v1
- Date: Tue, 14 Apr 2026 09:44:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.380622
- Title: NTIRE 2026 The 3rd Restore Any Image Model (RAIM) Challenge: Professional Image Quality Assessment (Track 1)
- Title(参考訳): NTIRE 2026 The 3rd Restore Any Image Model (RAIM) Challenge: Professional Image Quality Assessment (Track 1)
- Authors: Guanyi Qin, Jie Liang, Bingbing Zhang, Lishen Qu, Ya-nan Guan, Hui Zeng, Lei Zhang, Radu Timofte, Jianhui Sun, Xinli Yue, Tao Shao, Huan Hou, Wenjie Liao, Shuhao Han, Jieyu Yuan, Chunle Guo, Chongyi Li, Zewen Chen, Yunze Liu, Jian Guo, Juan Wang, Yun Zeng, Bing Li, Weiming Hu, Hesong Li, Dehua Liu, Xinjie Zhang, Qiang Li, Li Yan, Wei Dong, Qingsen Yan, Xingcan Li, Shenglong Zhou, Manjiang Yin, Yinxiang Zhang, Hongbo Wang, Jikai Xu, Zhaohui Fan, Dandan Zhu, Wei Sun, Weixia Zhang, Kun Zhu, Nana Zhang, Kaiwei Zhang, Qianqian Zhang, Zhihan Zhang, William Gordon, Linwei Wu, Jiachen Tu, Guoyi Xu, Yaoxin Jiang, Cici Liu, Yaokun Shi,
- Abstract要約: NTIRE 2026 Challenge on the 3rd Restore Any Image Model in the Wildについて概説する。
この挑戦には200近い登録と2500以上の応募が集まった。
トップパフォーマンスの手法は、プロのIQAにおける芸術の状態を著しく向上させた。
- 参考スコア(独自算出の注目度): 115.35873876159131
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we present an overview of the NTIRE 2026 challenge on the 3rd Restore Any Image Model in the Wild, specifically focusing on Track 1: Professional Image Quality Assessment. Conventional Image Quality Assessment (IQA) typically relies on scalar scores. By compressing complex visual characteristics into a single number, these methods fundamentally struggle to distinguish subtle differences among uniformly high-quality images. Furthermore, they fail to articulate why one image is superior, lacking the reasoning capabilities required to provide guidance for vision tasks. To bridge this gap, recent advancements in Multimodal Large Language Models (MLLMs) offer a promising paradigm. Inspired by this potential, our challenge establishes a novel benchmark exploring the ability of MLLMs to mimic human expert cognition in evaluating high-quality image pairs. Participants were tasked with overcoming critical bottlenecks in professional scenarios, centering on two primary objectives: (1) Comparative Quality Selection: reliably identifying the visually superior image within a high-quality pair; and (2) Interpretative Reasoning: generating grounded, expert-level explanations that detail the rationale behind the selection. In total, the challenge attracted nearly 200 registrations and over 2,500 submissions. The top-performing methods significantly advanced the state of the art in professional IQA. The challenge dataset is available at https://github.com/narthchin/RAIM-PIQA, and the official homepage is accessible at https://www.codabench.org/competitions/12789/.
- Abstract(参考訳): 本稿では,3rd Restore Any Image Model in the Wild における NTIRE 2026 課題の概要について述べる。
従来の画像品質評価(IQA)はスカラースコアに依存している。
複雑な視覚的特徴を1つの数に圧縮することにより、これらの手法は、一様に高品質な画像の微妙な違いを区別するのに根本的に苦労する。
さらに、ある画像が優れている理由を明確に説明できず、視覚タスクのガイダンスを提供するために必要な推論能力が欠如している。
このギャップを埋めるために、最近のMLLM(Multimodal Large Language Models)の進歩は、有望なパラダイムを提供する。
この可能性にインスパイアされた我々の課題は、高品質の画像ペアの評価において、人間の専門家の認識を模倣するMLLMの能力を探求する新しいベンチマークを確立することである。
1)比較品質選択:高品質なペア内で視覚的に優れたイメージを確実に識別すること、(2)解釈的推論:基礎的、専門家レベルの説明を生成し、選択の背景にある理論的根拠を詳述すること。
この挑戦には200近い登録と2500以上の応募が集まった。
トップパフォーマンスの手法は、プロのIQAにおける最先端の技術を著しく向上させた。
チャレンジデータセットはhttps://github.com/narthchin/RAIM-PIQAで、公式ホームページはhttps://www.codabench.org/competitions/12789/でアクセスできる。
関連論文リスト
- NTIRE 2026 The 3rd Restore Any Image Model (RAIM) Challenge: AI Flash Portrait (Track 3) [127.69044386248355]
NTIRE 2026 3rd Restore Any Image Model (RAIM) の課題について概観する。
この課題は、現実世界の低照度肖像画復元のための新しいベンチマークを確立することを目的としている。
本報告では,課題の背景にあるモチベーション,データセット構築プロセス,評価指標,および競争のさまざまなフェーズについて詳述する。
論文 参考訳(メタデータ) (2026-04-13T09:30:56Z) - Q-Bench-Portrait: Benchmarking Multimodal Large Language Models on Portrait Image Quality Perception [101.76154325436544]
マルチモーダルな大規模言語モデル (MLLM) は、既存の低レベルビジョンベンチマークで顕著な性能を示している。
Q-Bench-Portraitは、画像品質の知覚に特化して設計された最初の総合的なベンチマークである。
論文 参考訳(メタデータ) (2026-01-26T10:37:20Z) - VQualA 2025 Challenge on Visual Quality Comparison for Large Multimodal Models: Methods and Results [106.15762208088985]
VQualA 2025 Challenge on Visual Quality Comparison for Large Multimodal Models ICCV 2025 Workshop on Visual Quality Assessment に参加して
課題は、複数の画像の視覚的品質の違いについて、オープンで詳細な推論を行うための最先端のLMMの評価と強化である。
約100人の参加者がエントリーを提出し、5つのモデルが品質評価に関する命令調整型LMMの出現能力を実証した。
論文 参考訳(メタデータ) (2025-09-11T07:00:50Z) - VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank [30.316630325648834]
推論による非参照IQA(NR-IQA)モデルであるVisualQuality-R1を導入し、強化学習でランク付けする。
VisualQuality-R1 は差別的深層学習に基づく NR-IQA モデルより一貫して優れていることを示す。
VisualQuality-R1は、コンテキスト的にリッチでヒューマンアラインな品質記述を生成することができる。
論文 参考訳(メタデータ) (2025-05-20T14:56:50Z) - Next Token Is Enough: Realistic Image Quality and Aesthetic Scoring with Multimodal Large Language Model [19.2881640541533]
大言語モデル(MLLM)は、画像品質評価(IQA)と画像審美評価(IAA)に大きな可能性を示している。
本稿では、RealQA(RealQA)と呼ばれる新しいデータセットについて紹介する。
これらの属性は、低レベル(例えば、画像の明瞭度)、中レベル(例えば、主観的完全性)、高レベル(例えば、構成)の3つのレベルにまたがる。
驚くべきことに、2つの重要な桁だけを予測することで、次のトークンパラダイムはSOTAのパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2025-03-08T09:49:10Z) - M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment [65.3860007085689]
M3-AGIQAは、AI生成画像のより人間らしく総合的な評価を可能にする包括的なフレームワークである。
モデル出力を人間の判断とより密接に整合させることで、M3-AGIQAは堅牢で解釈可能な品質スコアを提供する。
論文 参考訳(メタデータ) (2025-02-21T03:05:45Z) - UHD-IQA Benchmark Database: Pushing the Boundaries of Blind Photo Quality Assessment [4.563959812257119]
固定幅3840ピクセルの6073 UHD-1 (4K)画像からなる画像品質評価データセットを提案する。
私たちの作品は、高い技術品質の高度に美的な写真に焦点を当てており、文学のギャップを埋めています。
データセットには、クラウドソーシング調査を通じて得られた知覚的品質評価が注釈付けされている。
論文 参考訳(メタデータ) (2024-06-25T11:30:31Z) - Surveillance Face Anti-spoofing [81.50018853811895]
Face Anti-Spoofing (FAS) は、様々な物理的攻撃から顔認識システムを保護するために不可欠である。
本稿では,画像品質による性能劣化を軽減するために,コントラスト品質不変学習(CQIL)ネットワークを提案する。
多くの実験がSuHiFiMaskデータセットの品質と提案したCQILの優位性を検証する。
論文 参考訳(メタデータ) (2023-01-03T07:09:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。