論文の概要: Redefining Quality Criteria and Distance-Aware Score Modeling for Image Editing Assessment
- arxiv url: http://arxiv.org/abs/2604.12175v1
- Date: Tue, 14 Apr 2026 01:05:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.180599
- Title: Redefining Quality Criteria and Distance-Aware Score Modeling for Image Editing Assessment
- Title(参考訳): 画像編集評価のための品質基準の再定義と距離対応スコアモデリング
- Authors: Xinjie Zhang, Qiang Li, Xiaowen Ma, Axi Niu, Li Yan, Qingsen Yan,
- Abstract要約: IEQAはマルチモーダル入力と多次元評価よりも複雑な推論を必要とする。
本研究では,評価基準とスコア表現を共同で学習する統合フレームワークであるDefine-and-Score Image Editing Quality Assessment (DS-IEQA)を提案する。
2026 NTIRE X-AIGC Quality Assessment Track 2の4位にランクインした。
- 参考スコア(独自算出の注目度): 28.60763581601123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in image editing have heightened the need for reliable Image Editing Quality Assessment (IEQA). Unlike traditional methods, IEQA requires complex reasoning over multimodal inputs and multi-dimensional assessments. Existing MLLM-based approaches often rely on human heuristic prompting, leading to two key limitations: rigid metric prompting and distance-agnostic score modeling. These issues hinder alignment with implicit human criteria and fail to capture the continuous structure of score spaces. To address this, we propose Define-and-Score Image Editing Quality Assessment (DS-IEQA), a unified framework that jointly learns evaluation criteria and score representations. Specifically, we introduce Feedback-Driven Metric Prompt Optimization (FDMPO) to automatically refine metric definitions via probabilistic feedback. Furthermore, we propose Token-Decoupled Distance Regression Loss (TDRL), which decouples numerical tokens from language modeling to explicitly model score continuity through expected distance minimization. Extensive experiments show our method's superior performance; it ranks 4th in the 2026 NTIRE X-AIGC Quality Assessment Track 2 without any additional training data.
- Abstract(参考訳): 近年,画像編集の進歩により,画像編集品質評価(IEQA)の必要性が高まっている。
従来の方法とは異なり、IEQAはマルチモーダル入力や多次元評価よりも複雑な推論を必要とする。
既存のMLLMベースのアプローチは、しばしば人間のヒューリスティックなプロンプトに依存しており、厳密なメートル法プロンプトと距離に依存しないスコアモデリングという2つの重要な制限に繋がる。
これらの問題は、暗黙の人間の基準との整合を妨げ、スコア空間の連続的な構造を捉えるのに失敗する。
そこで我々は,評価基準と得点表現を共同で学習する統合フレームワークであるDefine-and-Score Image Editing Quality Assessment (DS-IEQA)を提案する。
具体的には,FDMPO(Feedback-Driven Metric Prompt Optimization)を導入し,確率的フィードバックによってパラメータ定義を自動的に洗練する。
さらに,TDRL(Token-Decoupled Distance Regression Loss)を提案する。
2026 NTIRE X-AIGC Quality Assessment Track 2の4位にランクインした。
関連論文リスト
- A Sanity Check on Composed Image Retrieval [91.95275287747499]
Composed Image Retrieval (CIR) は、参照画像からなるクエリと、所望の修正を指定する相対的なキャプションに基づいて、ターゲット画像を取得することを目的としている。
FISD(Fully-Informed Semantically-Diverse benchmark)は、参照ターゲット画像対の変数を正確に制御するために生成モデルを利用する。
本稿では,対話型シナリオにおける既存モデルの可能性を探るためのマルチラウンドエージェント評価フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-14T15:52:22Z) - Fine-Grained Human Pose Editing Assessment via Layer-Selective MLLMs [70.31435391393642]
我々は17の最先端編集モデルから1,700の標準化されたサンプルをベンチマークで紹介する。
層選択型マルチモーダル言語モデル(MLLM)に基づく統一フレームワークを提案する。
本フレームワークは,信頼性検出と多次元品質回帰の両方において優れた性能を実現する。
論文 参考訳(メタデータ) (2026-01-15T13:22:07Z) - Q-Ponder: A Unified Training Pipeline for Reasoning-based Visual Quality Assessment [10.701522670464463]
MLLM(Multimodal large language model)は、解釈可能な評価によって視覚的品質を評価する。
冷間開始段階と強化学習に基づく微調整段階からなる統合された2段階訓練枠組みを提案する。
これら2つの段階から派生したモデルをQ-Ponder-CIとQ-Ponderと呼ぶ。
論文 参考訳(メタデータ) (2025-06-03T10:11:51Z) - Evaluating Text-to-Image and Text-to-Video Synthesis with a Conditional Fréchet Distance [13.599366291595672]
視覚的忠実度とテキスト・プロンプトの整合性を評価する指標であるcFreDを1つのスコアにまとめる。
本研究は, テキスト条件付きモデルの系統評価において, cFreDを頑健で将来性のある指標として評価するものである。
論文 参考訳(メタデータ) (2025-03-27T17:35:14Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Evaluating Generative Language Models in Information Extraction as Subjective Question Correction [49.729908337372436]
本稿では,新しい評価手法SQC-Scoreを提案する。
主観的質問訂正の原則に着想を得て,新しい評価手法SQC-Scoreを提案する。
3つの情報抽出タスクの結果から,SQC-Scoreは基準値よりもアノテータの方が好ましいことが示された。
論文 参考訳(メタデータ) (2024-04-04T15:36:53Z) - TISE: A Toolbox for Text-to-Image Synthesis Evaluation [9.092600296992925]
単目的と多目的のテキスト・ツー・イメージ合成のための最先端手法の研究を行う。
これらの手法を評価するための共通フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-02T16:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。