論文の概要: Aesthetic Attribute Assessment of Images Numerically on Mixed
Multi-attribute Datasets
- arxiv url: http://arxiv.org/abs/2207.01806v1
- Date: Tue, 5 Jul 2022 04:42:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 02:58:21.726593
- Title: Aesthetic Attribute Assessment of Images Numerically on Mixed
Multi-attribute Datasets
- Title(参考訳): 混合マルチ属性データセットを用いた画像の美的属性評価
- Authors: Xin Jin, Xinning Li, Hao Lou, Chenyu Fan, Qiang Deng, Chaoen Xiao,
Shuai Cui, Amit Kumar Singh
- Abstract要約: 我々は、属性(AMD-A)を用いた美的混合データセットと呼ばれる画像属性データセットを構築し、融合のための外部属性特徴を設計する。
我々のモデルは、美的分類、総合評価、属性スコアを達成できる。
MindSporeを用いた実験結果から,本手法は審美的総合評価と属性評価を効果的に改善できることが示された。
- 参考スコア(独自算出の注目度): 16.120684660965978
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the continuous development of social software and multimedia technology,
images have become a kind of important carrier for spreading information and
socializing. How to evaluate an image comprehensively has become the focus of
recent researches. The traditional image aesthetic assessment methods often
adopt single numerical overall assessment scores, which has certain
subjectivity and can no longer meet the higher aesthetic requirements. In this
paper, we construct an new image attribute dataset called aesthetic mixed
dataset with attributes(AMD-A) and design external attribute features for
fusion. Besides, we propose a efficient method for image aesthetic attribute
assessment on mixed multi-attribute dataset and construct a multitasking
network architecture by using the EfficientNet-B0 as the backbone network. Our
model can achieve aesthetic classification, overall scoring and attribute
scoring. In each sub-network, we improve the feature extraction through ECA
channel attention module. As for the final overall scoring, we adopt the idea
of the teacher-student network and use the classification sub-network to guide
the aesthetic overall fine-grain regression. Experimental results, using the
MindSpore, show that our proposed method can effectively improve the
performance of the aesthetic overall and attribute assessment.
- Abstract(参考訳): ソーシャルソフトウェアとマルチメディア技術の継続的な発展により、画像は情報の拡散とソーシャル化にとって重要なキャリアとなった。
画像を包括的に評価する方法が最近の研究の焦点となっている。
従来の画像美的評価法は、特定の主観性を持ち、もはやより高い美的要件を満たせない単一の数値的総合評価スコアをしばしば採用している。
本稿では,属性を付加した美的混合データセット(AMD-A)と呼ばれる新しい画像属性データセットを構築し,融合のための外部属性特徴を設計する。
また,複数属性の混合データセットを用いた画像美的属性評価の効率的な手法を提案し,backboneネットワークとして efficientnet-b0 を用いてマルチタスクネットワークアーキテクチャを構築する。
我々のモデルは、美的分類、総合評価、属性スコアを達成できる。
各サブネットワークにおいて、ECAチャネルアテンションモジュールによる特徴抽出を改善する。
最終得点については,教師・学生ネットワークの考え方を採用し,分類サブネットワークを用いて審美的総合的細粒回帰を指導する。
MindSporeを用いた実験結果から,本手法は審美的総合評価と属性評価を効果的に改善できることが示された。
関連論文リスト
- Predicting Scores of Various Aesthetic Attribute Sets by Learning from
Overall Score Labels [54.63611854474985]
本稿では,画像属性ラベルを特徴抽出器に置き換えることを提案する。
異なるタスクのネットワークを使用して、F2Sモデルに属性機能を提供します。
本手法は, 各種の美的属性セットに対して, 総合的な美的スコアのみを用いて有意な属性スコアを学習できるようにする。
論文 参考訳(メタデータ) (2023-12-06T01:41:49Z) - UMAAF: Unveiling Aesthetics via Multifarious Attributes of Images [16.647573404422175]
画像の絶対属性と相対属性の両方をモデル化する統一多属性美意識評価フレームワーク(UMAAF)を提案する。
UMAAFは、TAD66KとAVAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-19T11:57:01Z) - Multi-task convolutional neural network for image aesthetic assessment [0.0]
美的属性を考慮したマルチタスク畳み込みニューラルネットワークを提案する。
提案したニューラルネットワークは、画像の全体的な美的スコアとともに属性を共同で学習する。
我々は,スピアマンのランク相関を考慮に入れた場合,全身の美的スコアからほぼ人間に近いパフォーマンスを得る。
論文 参考訳(メタデータ) (2023-05-16T11:56:02Z) - VILA: Learning Image Aesthetics from User Comments with Vision-Language
Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。
具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。
以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-03-24T23:57:28Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文 参考訳(メタデータ) (2021-11-08T17:16:38Z) - Combining Image Features and Patient Metadata to Enhance Transfer
Learning [0.0]
画像特徴のみを用いる場合の分類作業における6つの最先端ディープニューラルネットワークの性能と,これらを患者のメタデータと組み合わせた場合の比較を行った。
以上の結果から,この性能向上はディープネットワークの一般的な特性である可能性が示唆され,他の分野での探索が望まれる。
論文 参考訳(メタデータ) (2021-10-08T15:43:31Z) - Learning to Infer Unseen Attribute-Object Compositions [55.58107964602103]
単一属性と多属性オブジェクトの両方を柔軟に認識できるグラフベースモデルを提案する。
我々は116,099の画像と8,030の合成カテゴリを持つ大規模マルチ属性データセットを構築した。
論文 参考訳(メタデータ) (2020-10-27T14:57:35Z) - Saliency-driven Class Impressions for Feature Visualization of Deep
Neural Networks [55.11806035788036]
分類に欠かせないと思われる特徴を視覚化することは有利である。
既存の可視化手法は,背景特徴と前景特徴の両方からなる高信頼画像を生成する。
本研究では,あるタスクにおいて最も重要であると考えられる識別的特徴を可視化するための,サリエンシ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-31T06:11:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。