論文の概要: Aesthetics Without Semantics
- arxiv url: http://arxiv.org/abs/2505.05331v1
- Date: Thu, 08 May 2025 15:22:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.936002
- Title: Aesthetics Without Semantics
- Title(参考訳): 意味論のない美学
- Authors: C. Alejandro Parraga, Olivier Penacchio, Marcos Muňoz Gonzalez, Bogdan Raducanu, Xavier Otazu,
- Abstract要約: セマンティックコンテンツを最小限に抑えた画像データベースを作成し,美的評価の悪面から画像を生成する手法を考案する。
画像の特徴と美的評価との間には, 美しい画像に偏った画像が, どのように修正されるか, あるいは逆転するかが示される。
- 参考スコア(独自算出の注目度): 3.644950723229025
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While it is easy for human observers to judge an image as beautiful or ugly, aesthetic decisions result from a combination of entangled perceptual and cognitive (semantic) factors, making the understanding of aesthetic judgements particularly challenging from a scientific point of view. Furthermore, our research shows a prevailing bias in current databases, which include mostly beautiful images, further complicating the study and prediction of aesthetic responses. We address these limitations by creating a database of images with minimal semantic content and devising, and next exploiting, a method to generate images on the ugly side of aesthetic valuations. The resulting Minimum Semantic Content (MSC) database consists of a large and balanced collection of 10,426 images, each evaluated by 100 observers. We next use established image metrics to demonstrate how augmenting an image set biased towards beautiful images with ugly images can modify, or even invert, an observed relationship between image features and aesthetics valuation. Taken together, our study reveals that works in empirical aesthetics attempting to link image content and aesthetic judgements may magnify, underestimate, or simply miss interesting effects due to a limitation of the range of aesthetic values they consider.
- Abstract(参考訳): 人間の観察者がイメージを美しいもの、またはいものと見なすのは容易であるが、審美的判断は、絡み合った知覚と認知(意味)の要素の組み合わせから生じるものであり、特に科学的観点からの審美的判断の理解は困難である。
さらに,本研究は,主に美しい画像を含む現在のデータベースに偏りがみられ,審美的応答の予測や研究が複雑化していることを示す。
これらの制約に対処するために、最小限のセマンティックコンテンツを持つ画像のデータベースを作成し、次に、美的評価の悪面から画像を生成する手法を考案する。
得られた最小セマンティックコンテンツ(MSC)データベースは、100人のオブザーバーによって評価された10,426枚の画像の大規模かつバランスの取れたコレクションで構成されている。
次に、確立された画像メトリクスを使用して、美しい画像に偏った画像の増分が、画像の特徴と美的評価の間の観察された関係を、どのように修正、あるいは逆転させるかを示す。
今回の研究では、画像の内容と美的判断をリンクしようとする経験的美学の作業が、彼らが考慮する美的価値の範囲の制限により、興味ある効果を拡大、過小評価、あるいは単に見逃す可能性があることを明らかにした。
関連論文リスト
- For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives [3.418398936676879]
この研究は、ソーシャルメディアプラットフォームにおける画像の社会的・文化的影響を大規模に調査するためのフレームワークであるFRESCOを提示する。
FRESCOは、最新のコンピュータビジョン技術を用いて、画像を数値変数と分類変数に分解する。
このフレームワークは、線や色のような基本的な視覚的特徴を含むプラスティックレベル、特定の実体や概念を表す図形レベル、特にオブザーバーとオブザーバーの視点を構築することに焦点を当てた啓示レベルという3つのレベルにわたって画像を分析する。
論文 参考訳(メタデータ) (2024-07-03T16:57:38Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - Image Aesthetics Assessment via Learnable Queries [59.313054821874864]
本稿では,IAA-LQを用いた画像美学評価手法を提案する。
フリーズされた画像エンコーダから得られた事前訓練された画像特徴から、学習可能なクエリを適応して美的特徴を抽出する。
実世界のデータに関する実験では、IAA-LQの利点が示され、SRCCとPLCCでそれぞれ2.2%、そして2.1%が最先端の手法に勝っている。
論文 参考訳(メタデータ) (2023-09-06T09:42:16Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - VILA: Learning Image Aesthetics from User Comments with Vision-Language
Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。
具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。
以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-03-24T23:57:28Z) - Exploring CLIP for Assessing the Look and Feel of Images [87.97623543523858]
ゼロショット方式で画像の品質知覚(ルック)と抽象知覚(フィール)の両方を評価するために,コントラスト言語-画像事前学習(CLIP)モデルを導入する。
以上の結果から,CLIPは知覚的評価によく適合する有意義な先行情報を捉えることが示唆された。
論文 参考訳(メタデータ) (2022-07-25T17:58:16Z) - Understanding Aesthetics with Language: A Photo Critique Dataset for
Aesthetic Assessment [6.201485014848172]
74K画像と220Kコメントを含むCritique Photo Redditデータセット(RPCD)を提案する。
我々は、美的判断の指標として批判の感情の極性を利用する。
論文 参考訳(メタデータ) (2022-06-17T08:16:20Z) - A Hypothesis for the Aesthetic Appreciation in Neural Networks [17.58003267114874]
本稿では,ニューラルネットワークが有能な概念を強化し,感覚的概念を捨てる,という美的評価の仮説を提案する。
実験では,修正された画像は原画像よりもある程度美的であることが判明した。
論文 参考訳(メタデータ) (2021-07-31T06:19:00Z) - A Survey of Hand Crafted and Deep Learning Methods for Image Aesthetic
Assessment [2.9005223064604078]
本稿では,最近の自動画像美学評価技術について文献的考察を行う。
伝統的なハンドクラフトとディープラーニングベースのアプローチが多数レビューされています。
論文 参考訳(メタデータ) (2021-03-22T07:00:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。