Fugu-MT 論文翻訳(概要): Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

論文の概要: Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

arxiv url: http://arxiv.org/abs/2603.11024v1
Date: Wed, 11 Mar 2026 17:49:45 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-12 16:22:33.087515
Title: Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style
Title（参考訳）: AIは美術史家に似ているか? 視覚言語モデルがいかに芸術的スタイルを認識するか
Authors: Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown,
Abstract要約: VLMの芸術的スタイル予測能力の基盤となるメカニズムを特徴付ける。我々は、アートスタイルの予測を駆動する概念を特定するために、潜在空間分解アプローチを採用する。スタイルの予測に無関係な概念が使われた場合、美術史家はその成功の可能性がある理由を特定した。
参考スコア（独自算出の注目度）: 60.562013130566726
License: http://creativecommons.org/licenses/by/4.0/
Abstract: VLMs have become increasingly proficient at a range of computer vision tasks, such as visual question answering and object detection. This includes increasingly strong capabilities in the domain of art, from analyzing artwork to generation of art. In an interdisciplinary collaboration between computer scientists and art historians, we characterize the mechanisms underlying VLMs' ability to predict artistic style and assess the extent to which they align with the criteria art historians use to reason about artistic style. We employ a latent-space decomposition approach to identify concepts that drive art style prediction and conduct quantitative evaluations, causal analysis and assessment by art historians. Our findings indicate that 73% of the extracted concepts are judged by art historians to exhibit a coherent and semantically meaningful visual feature and 90% of concepts used to predict style of a given artwork were judged relevant. In cases where an irrelevant concept was used to successfully predict style, art historians identified possible reasons for its success; for example, the model might "understand" a concept in more formal terms, such as dark/light contrasts.
Abstract（参考訳）: VLMは、視覚的質問応答や物体検出など、コンピュータビジョンのタスクに精通している。これには、アートの領域において、アートの分析から芸術の世代に至るまで、ますます強力な能力が含まれる。コンピュータ科学者と美術史家の学際的なコラボレーションにおいて、VLMが芸術的スタイルを予測する能力の基盤となるメカニズムを特徴づけ、美術史家が芸術的スタイルを推論するために使用する基準に適合する程度を評価する。我々は,アートスタイルの予測を駆動し,定量的評価,因果解析,そして美術史家による評価を行う概念を特定するために,潜在空間分解アプローチを採用している。その結果, 抽出された概念の73%は, 一貫性のある意味的に意味のある視覚的特徴を示すものとして, 美術史家によって判断され, 美術作品のスタイルを予測するために使用される概念の90%は, 関連性があることが示唆された。スタイルをうまく予測するために無関係な概念が使われた場合、美術史家は、その成功の可能性がある理由を特定した。

関連論文リスト

The persistence of painting styles [0.0]
トポロジカルデータ解析の手法である持続的ホモロジー(PH)が,芸術的スタイルに対する客観的かつ解釈可能な洞察をいかに提供するかを示す。統計的確証を持って、PHがアーティストと異なる芸術的流路と同一の流路を区別できることを示し、アーティストのイメージとアーティストのスタイルのAI生成画像とを区別する。
論文参考訳（メタデータ） (2025-11-17T13:25:04Z)
Have Large Vision-Language Models Mastered Art History? [3.790400719319821]
VLM(Vision-Language Models)が絵画のスタイル、作者、制作日を分類できるかどうかを検証する。美術史家たちは長い間、芸術のユニークな側面を研究してきたが、スタイル予測はその分野の重要な要素であった。
論文参考訳（メタデータ） (2024-09-05T13:33:57Z)
Diffusion-Based Visual Art Creation: A Survey and New Perspectives [51.522935314070416]
本調査は,拡散に基づく視覚芸術創造の新たな領域を探求し,その発展を芸術的,技術的両面から検討する。本研究は,芸術的要件が技術的課題にどのように変換されるかを明らかにし,視覚芸術創造における拡散法の設計と応用を強調した。我々は、AIシステムが芸術的知覚と創造性において人間の能力をエミュレートし、潜在的に増強するメカニズムに光を当てることを目指している。
論文参考訳（メタデータ） (2024-08-22T04:49:50Z)
GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。 LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文参考訳（メタデータ） (2024-08-01T11:52:56Z)
AI Art Neural Constellation: Revealing the Collective and Contrastive State of AI-Generated and Human Art [36.21731898719347]
我々は、人間の芸術遺産の文脈内でAI生成芸術を位置づけるための包括的な分析を行う。私たちの比較分析は、ArtConstellationと呼ばれる広範なデータセットに基づいています。鍵となる発見は、1800-2000年に作られた現代美術の原理とAIが生成したアートアートが視覚的に関連していることである。
論文参考訳（メタデータ） (2024-02-04T11:49:51Z)
Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文参考訳（メタデータ） (2023-10-27T04:30:18Z)
Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文参考訳（メタデータ） (2023-05-08T17:58:27Z)
How Deep is Your Art: An Experimental Study on the Limits of Artistic Understanding in a Single-Task, Single-Modality Neural Network [0.0]
本稿では,最先端のDeep Convolutional Neural Network(DCNN)が,現代美術作品とアートキュレーターが考案したギャラリーを正確に区別できる程度を実験的に検討した。
論文参考訳（メタデータ） (2022-03-30T03:32:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。