論文の概要: AesTest: Measuring Aesthetic Intelligence from Perception to Production
- arxiv url: http://arxiv.org/abs/2511.06360v1
- Date: Sun, 09 Nov 2025 12:44:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.902281
- Title: AesTest: Measuring Aesthetic Intelligence from Perception to Production
- Title(参考訳): AesTest: 知覚から生産まで、美的知性を測定する
- Authors: Guolong Wang, Heng Huang, Zhiqiang Zhang, Wentian Li, Feilong Ma, Xin Jin,
- Abstract要約: AesTestはマルチモーダルな審美的認識とプロダクションのためのベンチマークである。
それは10のタスクにまたがる複数の選択の質問から成り、知覚、鑑賞、創造、写真などをカバーする。
プロの編集、写真合成チュートリアル、クラウドソースによる好みなど、さまざまなソースのデータを統合している。
IAA MLLM と一般MLLM の両方を AesTest 上で評価し,審美的知能構築における重要な課題を明らかにした。
- 参考スコア(独自算出の注目度): 48.70942686586114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perceiving and producing aesthetic judgments is a fundamental yet underexplored capability for multimodal large language models (MLLMs). However, existing benchmarks for image aesthetic assessment (IAA) are narrow in perception scope or lack the diversity needed to evaluate systematic aesthetic production. To address this gap, we introduce AesTest, a comprehensive benchmark for multimodal aesthetic perception and production, distinguished by the following features: 1) It consists of curated multiple-choice questions spanning ten tasks, covering perception, appreciation, creation, and photography. These tasks are grounded in psychological theories of generative learning. 2) It integrates data from diverse sources, including professional editing workflows, photographic composition tutorials, and crowdsourced preferences. It ensures coverage of both expert-level principles and real-world variation. 3) It supports various aesthetic query types, such as attribute-based analysis, emotional resonance, compositional choice, and stylistic reasoning. We evaluate both instruction-tuned IAA MLLMs and general MLLMs on AesTest, revealing significant challenges in building aesthetic intelligence. We will publicly release AesTest to support future research in this area.
- Abstract(参考訳): 美的判断の知覚と生成は、マルチモーダル大言語モデル(MLLM)の基本的かつ未解明の能力である。
しかし、画像美的評価(IAA)のための既存のベンチマークは、知覚範囲が狭く、または、体系的な審美的生産を評価するために必要な多様性が欠如している。
このギャップに対処するため、私たちは、マルチモーダルな美的知覚とプロダクションのための包括的なベンチマークであるAesTestを紹介した。
1)10タスクにまたがる複数の選択質問からなり,認識,鑑賞,創造,写真などをカバーする。
これらの課題は、生成学習の心理学理論に根ざしている。
2)プロの編集ワークフロー,写真合成チュートリアル,クラウドソースによる嗜好など,さまざまなソースのデータを統合している。
専門家レベルの原則と実世界のバリエーションの両方を確実にカバーします。
3)属性に基づく分析,感情共鳴,構成選択,スタイリスティック推論など,さまざまな美的クエリタイプをサポートする。
IAA MLLM と一般MLLM の両方を AesTest 上で評価し,審美的知能構築における重要な課題を明らかにした。
この領域における将来の研究をサポートするために、AesTestを公開します。
関連論文リスト
- Advancing Comprehensive Aesthetic Insight with Multi-Scale Text-Guided Self-Supervised Learning [14.405750888492735]
Image Aesthetic Assessment (IAA) は、画像の美的価値を分析し評価する作業である。
IAAの伝統的な手法は、しばしば単一の美的タスクに集中し、ラベル付きデータセットが不十分である。
審美的洞察をニュアンス化した総合的審美的MLLMを提案する。
論文 参考訳(メタデータ) (2024-12-16T16:35:35Z) - AesExpert: Towards Multi-modality Foundation Model for Image Aesthetics Perception [74.11069437400398]
我々は,21,904の多様なソースイメージと88Kの人間の自然言語フィードバックを備えたコーパスリッチな審美的批評データベースを開発した。
AesExpertと呼ばれる、マルチモダリティのAesthetic Expertモデルを実現するために、オープンソースの一般基盤モデルを微調整します。
実験により、提案したAesExpertモデルは、最先端のMLLMよりもはるかに優れた審美的知覚性能を提供することが示された。
論文 参考訳(メタデータ) (2024-04-15T09:56:20Z) - AesBench: An Expert Benchmark for Multimodal Large Language Models on
Image Aesthetics Perception [64.25808552299905]
AesBenchはMLLMの審美的知覚能力の総合評価を目的とした専門家ベンチマークである。
本稿では,プロの審美専門家が提供した多彩な画像内容と高品質なアノテーションを特徴とするEAPD(Expert-labeled Aesthetics Perception Database)を構築した。
本稿では,知覚(AesP),共感(AesE),評価(AesA),解釈(AesI)の4つの視点からMLLMの審美的知覚能力を測定するための統合的基準を提案する。
論文 参考訳(メタデータ) (2024-01-16T10:58:07Z) - Q-Align: Teaching LMMs for Visual Scoring via Discrete Text-Defined
Levels [95.44077384918725]
スコアの代わりにテキスト定義のレーティングレベルを持つ大規模マルチモーダリティモデル(LMM)を提案する。
提案したQ-Alignは、画像品質評価(IQA)、画像美学評価(IAA)、映像品質評価(VQA)タスクにおける最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-12-28T16:10:25Z) - Unveiling The Factors of Aesthetic Preferences with Explainable AI [0.0]
本研究では,機械学習(ML)モデルを用いて,新しい視点を開拓する。
我々のモデルはこれらの属性を入力として処理し、画像の美的スコアを予測する。
本研究の目的は,画像における審美的嗜好の複雑な性質をMLを通して明らかにし,審美的判断に影響を及ぼす属性をより深く理解することである。
論文 参考訳(メタデータ) (2023-11-24T11:06:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。