論文の概要: Composition and Style Attributes Guided Image Aesthetic Assessment
- arxiv url: http://arxiv.org/abs/2111.04647v1
- Date: Mon, 8 Nov 2021 17:16:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 18:50:00.723794
- Title: Composition and Style Attributes Guided Image Aesthetic Assessment
- Title(参考訳): 構成とスタイル属性による画像美的評価
- Authors: Luigi Celona and Marco Leonardi and Paolo Napoletano and Alessandro
Rozza
- Abstract要約: 本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
- 参考スコア(独自算出の注目度): 66.60253358722538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The aesthetic quality of an image is defined as the measure or appreciation
of the beauty of an image. Aesthetics is inherently a subjective property but
there are certain factors that influence it such as, the semantic content of
the image, the attributes describing the artistic aspect, the photographic
setup used for the shot, etc. In this paper we propose a method for the
automatic prediction of the aesthetics of an image that is based on the
analysis of the semantic content, the artistic style and the composition of the
image. The proposed network includes: a pre-trained network for semantic
features extraction (the Backbone); a Multi Layer Perceptron (MLP) network that
relies on the Backbone features for the prediction of image attributes (the
AttributeNet); a self-adaptive Hypernetwork that exploits the attributes prior
encoded into the embedding generated by the AttributeNet to predict the
parameters of the target network dedicated to aesthetic estimation (the
AestheticNet). Given an image, the proposed multi-network is able to predict:
style and composition attributes, and aesthetic score distribution. Results on
three benchmark datasets demonstrate the effectiveness of the proposed method,
while the ablation study gives a better understanding of the proposed network.
- Abstract(参考訳): 画像の美的品質は、画像の美しさの尺度または評価として定義される。
美学は本質的に主観的な性質であるが、イメージの意味的内容、芸術的側面を記述した属性、撮影に使用される写真設定など、それに影響を与えるいくつかの要因がある。
本稿では,画像の意味的内容,芸術的スタイル,構成の分析に基づいて,画像の審美性を自動的に予測する手法を提案する。
提案ネットワークは、セマンティックな特徴抽出のための事前訓練されたネットワーク(Backbone)、画像属性の予測にBackboneの機能に依存するMulti Layer Perceptron(MLP)ネットワーク(AttributeNet)、AttributeNetが生成した埋め込みに予めエンコードされた属性を利用する自己適応型ハイパーネット(AttributeNet)により、美的推定専用のターゲットネットワークのパラメータを予測する(AestheticNet)。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
3つのベンチマークデータセットの結果から,提案手法の有効性が示された。
関連論文リスト
- Predicting Scores of Various Aesthetic Attribute Sets by Learning from
Overall Score Labels [54.63611854474985]
本稿では,画像属性ラベルを特徴抽出器に置き換えることを提案する。
異なるタスクのネットワークを使用して、F2Sモデルに属性機能を提供します。
本手法は, 各種の美的属性セットに対して, 総合的な美的スコアのみを用いて有意な属性スコアを学習できるようにする。
論文 参考訳(メタデータ) (2023-12-06T01:41:49Z) - UMAAF: Unveiling Aesthetics via Multifarious Attributes of Images [16.647573404422175]
画像の絶対属性と相対属性の両方をモデル化する統一多属性美意識評価フレームワーク(UMAAF)を提案する。
UMAAFは、TAD66KとAVAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-19T11:57:01Z) - Cross-Image Attention for Zero-Shot Appearance Transfer [68.43651329067393]
画像間の意味的対応を暗黙的に確立するクロスイメージアテンション機構を導入する。
ノイズの多い潜在コードを操作する3つのメカニズムと、デノナイジングプロセスを通してモデルの内部表現を利用する。
実験により,本手法は多種多様な対象カテゴリに対して有効であり,形状,大きさ,視点の変動に頑健であることが示された。
論文 参考訳(メタデータ) (2023-11-06T18:33:24Z) - Multi-task convolutional neural network for image aesthetic assessment [0.0]
美的属性を考慮したマルチタスク畳み込みニューラルネットワークを提案する。
提案したニューラルネットワークは、画像の全体的な美的スコアとともに属性を共同で学習する。
我々は,スピアマンのランク相関を考慮に入れた場合,全身の美的スコアからほぼ人間に近いパフォーマンスを得る。
論文 参考訳(メタデータ) (2023-05-16T11:56:02Z) - Modeling, Quantifying, and Predicting Subjectivity of Image Aesthetics [21.46956783120668]
本稿では,主観的美的嗜好をモデル化し,その主観的論理に基づいて定量化できる統一確率的枠組みを提案する。
この枠組みでは、評価分布をベータ分布としてモデル化し、確実に喜ぶ可能性、確実に不幸であり、不確実である可能性を得ることができる。
本稿では,画像美学の予測のための深層ニューラルネットワークの学習手法を提案する。
論文 参考訳(メタデータ) (2022-08-20T12:16:45Z) - Aesthetic Attribute Assessment of Images Numerically on Mixed
Multi-attribute Datasets [16.120684660965978]
我々は、属性(AMD-A)を用いた美的混合データセットと呼ばれる画像属性データセットを構築し、融合のための外部属性特徴を設計する。
我々のモデルは、美的分類、総合評価、属性スコアを達成できる。
MindSporeを用いた実験結果から,本手法は審美的総合評価と属性評価を効果的に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-05T04:42:10Z) - Semantic-Aware Generation for Self-Supervised Visual Representation
Learning [116.5814634936371]
セマンティック・アウェア・ジェネレーション(SaGe)は、生成した画像に保存される詳細よりも、よりリッチなセマンティクスを促進する。
SaGeは、ターゲットネットワークをビュー特有の特徴で補完することで、集中的なデータ拡張によって引き起こされるセマンティックな劣化を軽減する。
我々は、ImageNet-1K上でSaGeを実行し、近接検定、線形分類、微視的画像認識を含む5つの下流タスクで事前訓練されたモデルを評価する。
論文 参考訳(メタデータ) (2021-11-25T16:46:13Z) - What Image Features Boost Housing Market Predictions? [81.32205133298254]
本稿では,予測アルゴリズムにおける効率的な数値包摂のための視覚特徴抽出手法を提案する。
本稿では,シャノンのエントロピー,重心計算,画像分割,畳み込みニューラルネットワークなどの手法について論じる。
ここで選択された40の画像特徴のセットは、かなりの量の予測能力を持ち、最も強力なメタデータ予測器よりも優れています。
論文 参考訳(メタデータ) (2021-07-15T06:32:10Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - Unsupervised Domain Attention Adaptation Network for Caricature
Attribute Recognition [23.95731281719786]
キャラクチュア属性は、心理学と神経科学の研究に役立つ特徴的な顔の特徴を提供する。
注釈付き画像の量を持つ顔写真属性データセットとは異なり、似顔絵属性のアノテーションは稀である。
本稿では,画像の属性学習のための特徴属性データセットであるWebCariAを提案する。
論文 参考訳(メタデータ) (2020-07-18T06:38:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。