論文の概要: Aesthetic Attributes Assessment of Images with AMANv2 and DPC-CaptionsV2
- arxiv url: http://arxiv.org/abs/2208.04522v1
- Date: Tue, 9 Aug 2022 03:20:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:46:39.276942
- Title: Aesthetic Attributes Assessment of Images with AMANv2 and DPC-CaptionsV2
- Title(参考訳): AMANv2とDPC-CaptionsV2を用いた画像の美的属性評価
- Authors: Xinghui Zhou, Xin Jin, Jianwen Lv, Heng Huang, Ming Mao, Shuai Cui
- Abstract要約: DPC-CaptionsV2という新しいデータセットを半自動で構築する。
DPC-CaptionsV2の画像には、合成、照明、色、主題の4つの美的属性を含む。
本手法は,従来のAMANモデルよりも美的トピックに近い4つの美的属性に対するコメントを予測できる。
- 参考スコア(独自算出の注目度): 65.5524793975387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image aesthetic quality assessment is popular during the last decade. Besides
numerical assessment, nature language assessment (aesthetic captioning) has
been proposed to describe the generally aesthetic impression of an image. In
this paper, we propose aesthetic attribute assessment, which is the aesthetic
attributes captioning, i.e., to assess the aesthetic attributes such as
composition, lighting usage and color arrangement. It is a non-trivial task to
label the comments of aesthetic attributes, which limit the scale of the
corresponding datasets. We construct a novel dataset, named DPC-CaptionsV2, by
a semi-automatic way. The knowledge is transferred from a small-scale dataset
with full annotations to large-scale professional comments from a photography
website. Images of DPC-CaptionsV2 contain comments up to 4 aesthetic
attributes: composition, lighting, color, and subject. Then, we propose a new
version of Aesthetic Multi-Attributes Networks (AMANv2) based on the BUTD model
and the VLPSA model. AMANv2 fuses features of a mixture of small-scale PCCD
dataset with full annotations and large-scale DPCCaptionsV2 dataset with full
annotations. The experimental results of DPCCaptionsV2 show that our method can
predict the comments on 4 aesthetic attributes, which are closer to aesthetic
topics than those produced by the previous AMAN model. Through the evaluation
criteria of image captioning, the specially designed AMANv2 model is better to
the CNN-LSTM model and the AMAN model.
- Abstract(参考訳): 画像美的品質評価は過去10年間に人気がある。
画像の一般的な美的印象を記述するため,自然言語評価(審美的キャプション)が提案されている。
本稿では, 審美的属性のキャプションである審美的属性アセスメントを提案し, 構成, 照明使用量, 色調などの審美的属性を評価する。
美的属性のコメントをラベル付けするのは非自明な作業であり、対応するデータセットの規模を制限している。
DPC-CaptionsV2という新しいデータセットを半自動で構築する。
知識は、完全なアノテーションを備えた小規模データセットから、写真webサイトからの大規模専門家コメントに転送される。
DPC-CaptionsV2の画像には、合成、照明、色、主題の4つの美的属性を含む。
次に,BUTDモデルとVLPSAモデルに基づくAesthetic Multi-Attributes Networks (AMANv2) の新バージョンを提案する。
AMANv2は、フルアノテーション付き小規模PCCDデータセットとフルアノテーション付き大規模DPCCaptionsV2データセットを混合した機能を融合している。
DPCCaptionsV2の実験結果から,従来のAMANモデルよりも美的トピックに近い4つの美的属性に対するコメントを予測できることが示唆された。
画像キャプションの評価基準により、特別に設計されたAMANv2モデルは、CNN-LSTMモデルとAMANモデルより優れている。
関連論文リスト
- APDDv2: Aesthetics of Paintings and Drawings Dataset with Artist Labeled Scores and Comments [45.57709215036539]
Aesthetics Paintings and Drawings dataset (APDD)は,24の異なる芸術カテゴリーと10の美的属性を含む最初の総合的な絵画コレクションである。
APDDv2は画像コーパスを拡張し、アノテーションの品質を改善し、詳細な言語コメントを特徴としている。
本稿では,ArtCLIP(Art Assessment Network for Specific Painting Styles)の改訂版について紹介する。
論文 参考訳(メタデータ) (2024-11-13T11:46:42Z) - Predicting Scores of Various Aesthetic Attribute Sets by Learning from
Overall Score Labels [54.63611854474985]
本稿では,画像属性ラベルを特徴抽出器に置き換えることを提案する。
異なるタスクのネットワークを使用して、F2Sモデルに属性機能を提供します。
本手法は, 各種の美的属性セットに対して, 総合的な美的スコアのみを用いて有意な属性スコアを学習できるようにする。
論文 参考訳(メタデータ) (2023-12-06T01:41:49Z) - Image Aesthetics Assessment via Learnable Queries [59.313054821874864]
本稿では,IAA-LQを用いた画像美学評価手法を提案する。
フリーズされた画像エンコーダから得られた事前訓練された画像特徴から、学習可能なクエリを適応して美的特徴を抽出する。
実世界のデータに関する実験では、IAA-LQの利点が示され、SRCCとPLCCでそれぞれ2.2%、そして2.1%が最先端の手法に勝っている。
論文 参考訳(メタデータ) (2023-09-06T09:42:16Z) - VILA: Learning Image Aesthetics from User Comments with Vision-Language
Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。
具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。
以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-03-24T23:57:28Z) - Aesthetic Attribute Assessment of Images Numerically on Mixed
Multi-attribute Datasets [16.120684660965978]
我々は、属性(AMD-A)を用いた美的混合データセットと呼ばれる画像属性データセットを構築し、融合のための外部属性特徴を設計する。
我々のモデルは、美的分類、総合評価、属性スコアを達成できる。
MindSporeを用いた実験結果から,本手法は審美的総合評価と属性評価を効果的に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-05T04:42:10Z) - Personalized Image Aesthetics Assessment with Rich Attributes [35.61053167813472]
我々は、パーソナライズされた画像美学の最も包括的な主観的研究を行い、Rich Attributes (PARA) を用いたパーソナライズされた画像美学データベースを導入する。
PARAは、9つの画像指向の目的属性と4つの人間指向の主観的属性を含む、リッチなアノテーションを備えている。
また,条件付きPIAAモデルも提案する。
論文 参考訳(メタデータ) (2022-03-31T02:23:46Z) - User-Guided Personalized Image Aesthetic Assessment based on Deep
Reinforcement Learning [64.07820203919283]
本稿では,新しいユーザガイド型画像美観評価フレームワークを提案する。
深部強化学習(DRL)に基づく審美評価のためのユーザインタラクションを活用して画像のリタッチとランク付けを行う
パーソナライズされた審美分布は、異なるユーザの審美的嗜好とより一致している。
論文 参考訳(メタデータ) (2021-06-14T15:19:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。