論文の概要: BackFlip: The Impact of Local and Global Data Augmentations on Artistic Image Aesthetic Assessment
- arxiv url: http://arxiv.org/abs/2408.14173v1
- Date: Mon, 26 Aug 2024 10:39:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 14:23:20.205304
- Title: BackFlip: The Impact of Local and Global Data Augmentations on Artistic Image Aesthetic Assessment
- Title(参考訳): BackFlip: 局所的およびグローバルなデータ拡張が芸術的イメージ美的評価に与える影響
- Authors: Ombretta Strafforello, Gonzalo Muradas Odriozola, Fatemeh Behrad, Li-Wei Chen, Anne-Sofie Maerten, Derya Soydaner, Johan Wagemans,
- Abstract要約: 局所的およびグローバルなデータ拡張技術が芸術的イメージ美的評価(IAA)に及ぼす影響について検討する。
芸術的IAAに特化したローカルデータ拡張技術であるBackFlipを紹介する。
以上の結果から,BackFlip などの局所的な拡張は,芸術的IAA のグローバルな増強よりも優れる傾向が示唆された。
- 参考スコア(独自算出の注目度): 7.7311099081131465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Assessing the aesthetic quality of artistic images presents unique challenges due to the subjective nature of aesthetics and the complex visual characteristics inherent to artworks. Basic data augmentation techniques commonly applied to natural images in computer vision may not be suitable for art images in aesthetic evaluation tasks, as they can change the composition of the art images. In this paper, we explore the impact of local and global data augmentation techniques on artistic image aesthetic assessment (IAA). We introduce BackFlip, a local data augmentation technique designed specifically for artistic IAA. We evaluate the performance of BackFlip across three artistic image datasets and four neural network architectures, comparing it with the commonly used data augmentation techniques. Then, we analyze the effects of components within the BackFlip pipeline through an ablation study. Our findings demonstrate that local augmentations, such as BackFlip, tend to outperform global augmentations on artistic IAA in most cases, probably because they do not perturb the composition of the art images. These results emphasize the importance of considering both local and global augmentations in future computational aesthetics research.
- Abstract(参考訳): 芸術的イメージの美的品質を評価することは、美学の主観的な性質と、芸術作品に固有の複雑な視覚的特徴により、ユニークな課題を示す。
コンピュータビジョンにおける自然画像に一般的に適用される基本的データ拡張技術は、美的評価タスクにおける美術画像には適さないかもしれない。
本稿では,局所的およびグローバルなデータ拡張技術が芸術的イメージ美的評価(IAA)に与える影響について検討する。
芸術的IAAに特化したローカルデータ拡張技術であるBackFlipを紹介する。
3つの芸術的イメージデータセットと4つのニューラルネットワークアーキテクチャにまたがるBackFlipの性能を評価する。
次に,BackFlipパイプライン内の成分の影響をアブレーション研究により解析する。
以上の結果から,BackFlip などの局所的な拡張は,芸術的IAA のグローバルな増強よりも優れる傾向が示唆された。
これらの結果は、将来の計算美学研究において、局所的およびグローバル的な拡張の両方を考慮することの重要性を強調している。
関連論文リスト
- APDDv2: Aesthetics of Paintings and Drawings Dataset with Artist Labeled Scores and Comments [45.57709215036539]
Aesthetics Paintings and Drawings dataset (APDD)は,24の異なる芸術カテゴリーと10の美的属性を含む最初の総合的な絵画コレクションである。
APDDv2は画像コーパスを拡張し、アノテーションの品質を改善し、詳細な言語コメントを特徴としている。
本稿では,ArtCLIP(Art Assessment Network for Specific Painting Styles)の改訂版について紹介する。
論文 参考訳(メタデータ) (2024-11-13T11:46:42Z) - GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文 参考訳(メタデータ) (2024-08-01T11:52:56Z) - Paintings and Drawings Aesthetics Assessment with Rich Attributes for Various Artistic Categories [47.705077586687196]
Aesthetics of Paintings and Drawingsデータセットは、合計4985枚の画像で構成され、注釈数は31100枚を超える。
APDDの建設は世界中の28人のプロアーティストから活発に参加し、芸術分野を専門とする数十人の学生が参加した。
最終的なAPDDデータセットは、合計4985のイメージで構成され、アノテーション数は31100を超える。
論文 参考訳(メタデータ) (2024-05-05T16:05:56Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - Diffusion Based Augmentation for Captioning and Retrieval in Cultural
Heritage [28.301944852273746]
本稿では,文化遺産領域における限られた注釈付きデータとドメインシフトの課題に対処する新しいアプローチを提案する。
生成的視覚言語モデルを活用することで、キャプションに条件付けされた多種多様なアート作品を生成することにより、アートデータセットを増強する。
論文 参考訳(メタデータ) (2023-08-14T13:59:04Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - Towards Artistic Image Aesthetics Assessment: a Large-scale Dataset and
a New Method [64.40494830113286]
まず、Boldbrush Artistic Image dataset (BAID)という大規模なAIAAデータセットを紹介します。
そこで我々は,芸術的イメージを評価するために,スタイル特異的で汎用的な美的情報を効果的に抽出し,活用する新たな手法であるSAANを提案する。
実験により,提案手法は提案したBAIDデータセット上で既存のIAA手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-27T12:59:15Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Learning Portrait Style Representations [34.59633886057044]
高レベル特性を取り入れたニューラルネットワークアーキテクチャによって学習されたスタイル表現について検討する。
美術史家によって注釈付けされた三重奏曲をスタイル類似性の監督として取り入れることで,学習スタイルの特徴の変化を見いだす。
また,計算解析用に用意された肖像画の大規模データセットを初めて提示する。
論文 参考訳(メタデータ) (2020-12-08T01:36:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。