論文の概要: On the Role of Individual Differences in Current Approaches to Computational Image Aesthetics
- arxiv url: http://arxiv.org/abs/2502.20518v1
- Date: Thu, 27 Feb 2025 21:01:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:42:07.854841
- Title: On the Role of Individual Differences in Current Approaches to Computational Image Aesthetics
- Title(参考訳): コンピュータ画像美学へのアプローチにおける個人差の役割について
- Authors: Li-Wei Chen, Ombretta Strafforello, Anne-Sofie Maerten, Tinne Tuytelaars, Johan Wagemans,
- Abstract要約: 画像アセスメント(IAA)は、画像の多様性とユーザの主観性によって複雑なタスクである画像美学を評価する。
ジェネリックIAA(GIAA)モデルは平均麻酔スコアを推定し、パーソナライズIAA(PIAA)モデルは転送学習を用いてGIAAを適応し、ユーザ主観性を取り入れる。
この研究はIAAの理論的基盤を確立し、個々の特性を分布形式にエンコードする統一モデルを提案し、個人とグループの両方で評価する。
- 参考スコア(独自算出の注目度): 33.56831644348053
- License:
- Abstract: Image aesthetic assessment (IAA) evaluates image aesthetics, a task complicated by image diversity and user subjectivity. Current approaches address this in two stages: Generic IAA (GIAA) models estimate mean aesthetic scores, while Personal IAA (PIAA) models adapt GIAA using transfer learning to incorporate user subjectivity. However, a theoretical understanding of transfer learning between GIAA and PIAA, particularly concerning the impact of group composition, group size, aesthetic differences between groups and individuals, and demographic correlations, is lacking. This work establishes a theoretical foundation for IAA, proposing a unified model that encodes individual characteristics in a distributional format for both individual and group assessments. We show that transferring from GIAA to PIAA involves extrapolation, while the reverse involves interpolation, which is generally more effective for machine learning. Experiments with varying group compositions, including sub-sampling by group size and disjoint demographics, reveal significant performance variation even for GIAA, indicating that mean scores do not fully eliminate individual subjectivity. Performance variations and Gini index analysis reveal education as the primary factor influencing aesthetic differences, followed by photography and art experience, with stronger individual subjectivity observed in artworks than in photos. Our model uniquely supports both GIAA and PIAA, enhancing generalization across demographics.
- Abstract(参考訳): 画像美的評価(IAA)は、画像の多様性とユーザ主観性によって複雑化する課題である画像美的評価(英語版)を評価する。
ジェネリックIAA(GIAA)モデルは平均麻酔スコアを推定し、パーソナライズIAA(PIAA)モデルは転送学習を用いてGIAAを適応し、ユーザ主観性を取り入れる。
しかし,GIAAとPIAAの移行学習に関する理論的理解は,特にグループ構成の影響,グループサイズ,グループと個人間の美的差異,人口統計学的相関が欠如している。
この研究はIAAの理論的基盤を確立し、個々の特性を分布形式にエンコードする統一モデルを提案し、個人とグループの両方で評価する。
GIAAからPIAAへの転送には外挿が必要であり,逆の補間は一般的に機械学習に有効であることを示す。
グループサイズによるサブサンプリングや不随意な人口層によるグループ構成による実験は、GIAAにおいても顕著なパフォーマンス変化を示し、平均スコアが個別の主観性を完全に排除していないことを示している。
パフォーマンスの変化とジニ指数分析は、写真やアート体験に続き、写真よりも個々の主観性が強く、美的差異に影響を及ぼす主要な要因として教育を明らかにする。
我々のモデルはGIAAとPIAAの両方を独自にサポートし、人口統計学における一般化を促進する。
関連論文リスト
- A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.43992456058541]
画像復元(IR)とは、ノイズ、ぼかし、気象効果などの劣化を除去しながら、画像の視覚的品質を改善する過程である。
従来のIR手法は、一般的に特定の種類の劣化をターゲットとしており、複雑な歪みを伴う現実のシナリオにおいて、その効果を制限している。
オールインワン画像復元(AiOIR)パラダイムが登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-10-19T11:11:09Z) - Deep Learning Activation Functions: Fixed-Shape, Parametric, Adaptive, Stochastic, Miscellaneous, Non-Standard, Ensemble [0.0]
活性化関数(AF)は、ディープラーニングモデルのアーキテクチャにおいて重要な役割を果たす。
本稿では, 固定形, 適応型, 非標準型, アンサンブル/組合わせ型など, 様々な種類のAFについて概観する。
本研究は,12種類の最先端AFを比較検討した。
論文 参考訳(メタデータ) (2024-07-14T17:53:49Z) - Towards Geographic Inclusion in the Evaluation of Text-to-Image Models [25.780536950323683]
我々は,アフリカ,ヨーロッパ,東南アジアにおけるアノテータの地理的表現,視覚的魅力,実画像および生成画像の一貫性に対する認識の程度について検討した。
例えば、異なる場所のアノテータは、地理的に代表的であると見なされる領域の誇張されたステレオタイプ的な描写について、しばしば意見が一致しない。
自動評価と人的評価を改善するためのステップを推奨する。
論文 参考訳(メタデータ) (2024-05-07T16:23:06Z) - Adaptive Contextual Perception: How to Generalize to New Backgrounds and
Ambiguous Objects [75.15563723169234]
本研究では,視覚モデルが分布外一般化の文脈をどのように適応的に利用するかを検討する。
1つの設定で優れているモデルは、もう1つの設定で苦労する傾向があります。
生物学的視覚の一般化能力を再現するためには、コンピュータビジョンモデルは背景表現に対して分解対象を持つ必要がある。
論文 参考訳(メタデータ) (2023-06-09T15:29:54Z) - VILA: Learning Image Aesthetics from User Comments with Vision-Language
Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。
具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。
以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-03-24T23:57:28Z) - Distilling Knowledge from Object Classification to Aesthetics Assessment [68.317720070755]
画像美学アセスメント(IAA)の主なジレンマは、審美ラベルの抽象的な性質に由来する。
我々は,IAAモデルに対して,多様な画像内容のセマンティック・パターンに関する知識を抽出することを提案する。
蒸留知識を用いてエンド・ツー・エンドのシングルバックボーンIAAモデルを監督することにより、IAAモデルの性能が大幅に向上する。
論文 参考訳(メタデータ) (2022-06-02T00:39:01Z) - Mitigating Bias in Facial Analysis Systems by Incorporating Label
Diversity [4.089080285684415]
本研究では,顔の特徴の数学的定義に基づいて,主観的人間に基づくラベルと客観的アノテーションを組み合わせた新しい学習手法を提案する。
提案手法は,下流タスクの精度を高く保ちながら,意図しないバイアスを軽減できる。
論文 参考訳(メタデータ) (2022-04-13T13:17:27Z) - Personalized Image Aesthetics Assessment with Rich Attributes [35.61053167813472]
我々は、パーソナライズされた画像美学の最も包括的な主観的研究を行い、Rich Attributes (PARA) を用いたパーソナライズされた画像美学データベースを導入する。
PARAは、9つの画像指向の目的属性と4つの人間指向の主観的属性を含む、リッチなアノテーションを備えている。
また,条件付きPIAAモデルも提案する。
論文 参考訳(メタデータ) (2022-03-31T02:23:46Z) - Fair SA: Sensitivity Analysis for Fairness in Face Recognition [1.7149364927872013]
汎用フレームワークの形で頑健性に基づく新しい公正性評価を提案する。
我々は、一般的な顔認識モデルの性能を分析し、画像が摂動状態にある場合、ある種のサブグループが不利であることを実証的に示す。
論文 参考訳(メタデータ) (2022-02-08T01:16:09Z) - Understanding Adversarial Examples from the Mutual Influence of Images
and Perturbations [83.60161052867534]
クリーンな画像と敵の摂動を遠ざけることで敵の例を分析し,その相互への影響を分析した。
以上の結果から,画像と普遍摂動の関係に対する新たな視点が示唆された。
我々は、オリジナルトレーニングデータを活用することなく、目標とするユニバーサルアタックの挑戦的なタスクを最初に達成した人物です。
論文 参考訳(メタデータ) (2020-07-13T05:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。