Fugu-MT 論文翻訳(概要): Fine-grained Image Aesthetic Assessment: Learning Discriminative Scores from Relative Ranks

論文の概要: Fine-grained Image Aesthetic Assessment: Learning Discriminative Scores from Relative Ranks

arxiv url: http://arxiv.org/abs/2603.03907v1
Date: Wed, 04 Mar 2026 10:13:27 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-05 21:29:15.264395
Title: Fine-grained Image Aesthetic Assessment: Learning Discriminative Scores from Relative Ranks
Title（参考訳）: きめ細かい画像美的評価:相対ランクから識別スコアを学習する
Authors: Zhichao Yang, Jianjie Wang, Zhixianhe Zhang, Pangu Xie, Xiangfei Sheng, Pengfei Chen, Leida Li,
Abstract要約: 画像美学評価(IAA)は、コンテンツ作成、アルバム管理、レコメンデーションシステムに広く応用されている。最先端のIAAモデルは一般に粗い粒度の評価のために設計されている。相対ランクから識別的美的スコアを学習する新しいIAAフレームワークであるFGAesQを提案する。
参考スコア（独自算出の注目度）: 26.53088863857899
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image aesthetic assessment (IAA) has extensive applications in content creation, album management, and recommendation systems, etc. In such applications, it is commonly needed to pick out the most aesthetically pleasing image from a series of images with subtle aesthetic variations, a topic we refer to as fine-grained IAA. Unfortunately, state-of-the-art IAA models are typically designed for coarse-grained evaluation, where images with notable aesthetic differences are evaluated independently on an absolute scale. These models are inherently limited in discriminating fine-grained aesthetic differences. To address the dilemma, we contribute FGAesthetics, a fine-grained IAA database with 32,217 images organized into 10,028 series, which are sourced from diverse categories including Natural, AIGC, and Cropping. Annotations are collected via pairwise comparisons within each series. We also devise Series Refinement and Rank Calibration to ensure the reliability of data and labels. Based on FGAesthetics, we further propose FGAesQ, a novel IAA framework that learns discriminative aesthetic scores from relative ranks through Difference-preserved Tokenization (DiffToken), Comparative Text-assisted Alignment (CTAlign), and Rank-aware Regression (RankReg). FGAesQ enables accurate aesthetic assessment in fine-grained scenarios while still maintains competitive performance in coarse-grained evaluation. Extensive experiments and comparisons demonstrate the superiority of the proposed method.
Abstract（参考訳）: 画像美学評価(IAA)は、コンテンツ作成、アルバム管理、レコメンデーションシステムなどに広く応用されている。このようなアプリケーションでは、微妙な美的バリエーションを持つ一連の画像から、最も美的なイメージを抽出することが一般的である。残念なことに、最先端のIAAモデルは一般的に粗い粒度の評価のために設計されており、顕著な美的差異を持つ画像は絶対的なスケールで独立して評価される。これらのモデルは本質的に、きめ細かい美的相違を識別するのに限られている。このジレンマに対処するため、我々は、Natural、AIGC、Croppingといったさまざまなカテゴリから派生した、32,217の画像を10,028のシリーズに整理した、きめ細かいIAAデータベースであるFGAestheticsにコントリビュートする。アノテーションは各シリーズ内でペアワイズ比較によって収集される。また、データやラベルの信頼性を確保するために、シリーズリファインメントやランクキャリブレーションも考案しています。さらに,FGA美学に基づいて,差分保存トークン化(DiffToken),CTAlign(CTAlign),ランク認識回帰(RankReg)を通じて,相対ランクから識別的美的スコアを学習する新しいIAAフレームワークであるFGAesQを提案する。 FGAesQは、粗粒度評価において競争性能を維持しながら、きめ細かいシナリオで正確な美的評価を可能にする。提案手法の優位性を示す実験と比較を行った。

関連論文リスト

On the Role of Individual Differences in Current Approaches to Computational Image Aesthetics [38.85583529536269]
画像アセスメント(IAA)は、画像の多様性とユーザの主観性によって複雑なタスクである画像美学を評価する。ジェネリックIAA(GIAA)モデルは平均麻酔スコアを推定し、パーソナライズIAA(PIAA)モデルは転送学習を用いてGIAAを適応し、ユーザ主観性を取り入れる。この研究はIAAの理論的基盤を確立し、個々の特性を分布形式にエンコードする統一モデルを提案し、個人とグループの両方で評価する。
論文参考訳（メタデータ） (2025-02-27T21:01:19Z)
Image Aesthetics Assessment via Learnable Queries [59.313054821874864]
本稿では,IAA-LQを用いた画像美学評価手法を提案する。フリーズされた画像エンコーダから得られた事前訓練された画像特徴から、学習可能なクエリを適応して美的特徴を抽出する。実世界のデータに関する実験では、IAA-LQの利点が示され、SRCCとPLCCでそれぞれ2.2%、そして2.1%が最先端の手法に勝っている。
論文参考訳（メタデータ） (2023-09-06T09:42:16Z)
Towards Artistic Image Aesthetics Assessment: a Large-scale Dataset and a New Method [64.40494830113286]
まず、Boldbrush Artistic Image dataset (BAID)という大規模なAIAAデータセットを紹介します。そこで我々は,芸術的イメージを評価するために,スタイル特異的で汎用的な美的情報を効果的に抽出し,活用する新たな手法であるSAANを提案する。実験により,提案手法は提案したBAIDデータセット上で既存のIAA手法よりも優れていることが示された。
論文参考訳（メタデータ） (2023-03-27T12:59:15Z)
VILA: Learning Image Aesthetics from User Comments with Vision-Language Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文参考訳（メタデータ） (2023-03-24T23:57:28Z)
Distilling Knowledge from Object Classification to Aesthetics Assessment [68.317720070755]
画像美学アセスメント(IAA)の主なジレンマは、審美ラベルの抽象的な性質に由来する。我々は,IAAモデルに対して,多様な画像内容のセマンティック・パターンに関する知識を抽出することを提案する。蒸留知識を用いてエンド・ツー・エンドのシングルバックボーンIAAモデルを監督することにより、IAAモデルの性能が大幅に向上する。
論文参考訳（メタデータ） (2022-06-02T00:39:01Z)
A Compositional Feature Embedding and Similarity Metric for Ultra-Fine-Grained Visual Categorization [16.843126268445726]
きめ細かい視覚分類(FGVC)は、クラス間の差異が小さいオブジェクトを分類することを目的としている。本稿では,超微細な視覚分類のための新しい構成的特徴埋め込みと類似度指標(CECS)を提案する。最近のベンチマーク手法を用いた2つの超FGVCデータセットと1つのFGVCデータセットの実験結果から,提案手法が最先端性能を実現することを一貫して示している。
論文参考訳（メタデータ） (2021-09-25T15:05:25Z)
Learning Conditional Knowledge Distillation for Degraded-Reference Image Quality Assessment [157.1292674649519]
劣化参照IQA(DR-IQA)という実用的な解を提案する。 DR-IQAはIRモデルの入力、劣化したイメージを参照として利用する。私たちの結果は、フル参照設定のパフォーマンスに近いものもあります。
論文参考訳（メタデータ） (2021-08-18T02:35:08Z)
I Am Going MAD: Maximum Discrepancy Competition for Comparing Classifiers Adaptively [135.7695909882746]
我々は、MAD(Maximum Discrepancy)コンペティションを命名する。任意に大きいラベル付き画像のコーパスから小さなテストセットを適応的にサンプリングする。結果のモデル依存画像集合に人間のラベルを付けると、競合する分類器の相対的な性能が明らかになる。
論文参考訳（メタデータ） (2020-02-25T03:32:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。