論文の概要: User-Guided Personalized Image Aesthetic Assessment based on Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2106.07488v1
- Date: Mon, 14 Jun 2021 15:19:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 15:41:01.259561
- Title: User-Guided Personalized Image Aesthetic Assessment based on Deep
Reinforcement Learning
- Title(参考訳): 深層強化学習に基づくユーザ誘導型パーソナライズ画像美的評価
- Authors: Pei Lv, Jianqi Fan, Xixi Nie, Weiming Dong, Xiaoheng Jiang, Bing Zhou,
Mingliang Xu and Changsheng Xu
- Abstract要約: 本稿では,新しいユーザガイド型画像美観評価フレームワークを提案する。
深部強化学習(DRL)に基づく審美評価のためのユーザインタラクションを活用して画像のリタッチとランク付けを行う
パーソナライズされた審美分布は、異なるユーザの審美的嗜好とより一致している。
- 参考スコア(独自算出の注目度): 64.07820203919283
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Personalized image aesthetic assessment (PIAA) has recently become a hot
topic due to its usefulness in a wide variety of applications such as
photography, film and television, e-commerce, fashion design and so on. This
task is more seriously affected by subjective factors and samples provided by
users. In order to acquire precise personalized aesthetic distribution by small
amount of samples, we propose a novel user-guided personalized image aesthetic
assessment framework. This framework leverages user interactions to retouch and
rank images for aesthetic assessment based on deep reinforcement learning
(DRL), and generates personalized aesthetic distribution that is more in line
with the aesthetic preferences of different users. It mainly consists of two
stages. In the first stage, personalized aesthetic ranking is generated by
interactive image enhancement and manual ranking, meanwhile two policy networks
will be trained. The images will be pushed to the user for manual retouching
and simultaneously to the enhancement policy network. The enhancement network
utilizes the manual retouching results as the optimization goals of DRL. After
that, the ranking process performs the similar operations like the retouching
mentioned before. These two networks will be trained iteratively and
alternatively to help to complete the final personalized aesthetic assessment
automatically. In the second stage, these modified images are labeled with
aesthetic attributes by one style-specific classifier, and then the
personalized aesthetic distribution is generated based on the multiple
aesthetic attributes of these images, which conforms to the aesthetic
preference of users better.
- Abstract(参考訳): 近年,写真,映画,テレビ,電子商取引,ファッションデザインなど多岐にわたる応用において,個人化画像美的評価(PIAA)が注目されている。
このタスクは、ユーザが提供する主観的要因やサンプルによってより深刻な影響を受ける。
少量のサンプルで正確なパーソナライズされた美的分布を得るため,新たなユーザ誘導型パーソナライズ画像美的評価フレームワークを提案する。
本フレームワークは,ユーザ間のインタラクションを活用して,深層強化学習(DRL)に基づく審美評価のための画像のリタッチとランク付けを行い,異なるユーザの美的嗜好に合わせたパーソナライズされた審美分布を生成する。
主に2つの段階からなる。
第1段階では、インタラクティブな画像強調と手動ランキングによってパーソナライズされた審美的ランキングが生成され、2つのポリシーネットワークがトレーニングされる。
イメージは手作業でリタッチするためにユーザにプッシュされ、同時に強化ポリシーネットワークにもプッシュされる。
拡張ネットワークは、DRLの最適化目標として手動修正結果を利用する。
その後、ランキング処理は、前述したリタッチと同様の操作を実行する。
これら2つのネットワークは反復的かつ代替的にトレーニングされ、パーソナライズされた審美評価が自動的に完了する。
第2段階では、これらの修正された画像を1つのスタイル固有の分類器で美的属性にラベル付けし、それらの画像の複数の美的属性に基づいてパーソナライズされた美的分布を生成する。
関連論文リスト
- AID-AppEAL: Automatic Image Dataset and Algorithm for Content Appeal Enhancement and Assessment Labeling [11.996211235559866]
Image Content Appeal Assessment (ICAA) は、画像のコンテンツが視聴者に対して生成する肯定的な関心のレベルを定量化する新しいメトリクスである。
ICAAは、画像の芸術的品質を判断する伝統的な画像美学評価(IAA)とは異なる。
論文 参考訳(メタデータ) (2024-07-08T01:40:32Z) - Predicting Scores of Various Aesthetic Attribute Sets by Learning from
Overall Score Labels [54.63611854474985]
本稿では,画像属性ラベルを特徴抽出器に置き換えることを提案する。
異なるタスクのネットワークを使用して、F2Sモデルに属性機能を提供します。
本手法は, 各種の美的属性セットに対して, 総合的な美的スコアのみを用いて有意な属性スコアを学習できるようにする。
論文 参考訳(メタデータ) (2023-12-06T01:41:49Z) - Image Aesthetics Assessment via Learnable Queries [59.313054821874864]
本稿では,IAA-LQを用いた画像美学評価手法を提案する。
フリーズされた画像エンコーダから得られた事前訓練された画像特徴から、学習可能なクエリを適応して美的特徴を抽出する。
実世界のデータに関する実験では、IAA-LQの利点が示され、SRCCとPLCCでそれぞれ2.2%、そして2.1%が最先端の手法に勝っている。
論文 参考訳(メタデータ) (2023-09-06T09:42:16Z) - VILA: Learning Image Aesthetics from User Comments with Vision-Language
Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。
具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。
以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-03-24T23:57:28Z) - Aesthetic Attributes Assessment of Images with AMANv2 and DPC-CaptionsV2 [65.5524793975387]
DPC-CaptionsV2という新しいデータセットを半自動で構築する。
DPC-CaptionsV2の画像には、合成、照明、色、主題の4つの美的属性を含む。
本手法は,従来のAMANモデルよりも美的トピックに近い4つの美的属性に対するコメントを予測できる。
論文 参考訳(メタデータ) (2022-08-09T03:20:59Z) - Aesthetic Attribute Assessment of Images Numerically on Mixed
Multi-attribute Datasets [16.120684660965978]
我々は、属性(AMD-A)を用いた美的混合データセットと呼ばれる画像属性データセットを構築し、融合のための外部属性特徴を設計する。
我々のモデルは、美的分類、総合評価、属性スコアを達成できる。
MindSporeを用いた実験結果から,本手法は審美的総合評価と属性評価を効果的に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-05T04:42:10Z) - Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文 参考訳(メタデータ) (2021-11-08T17:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。