論文の概要: TraitSpaces: Towards Interpretable Visual Creativity for Human-AI Co-Creation
- arxiv url: http://arxiv.org/abs/2509.24326v1
- Date: Mon, 29 Sep 2025 06:24:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.781077
- Title: TraitSpaces: Towards Interpretable Visual Creativity for Human-AI Co-Creation
- Title(参考訳): TraitSpaces: 人間のAIコクリエーションのための解釈可能な視覚創造性を目指して
- Authors: Prerna Luthra,
- Abstract要約: 心理学からアーティストや理論を実践する実践者へのインタビューに基づいて、私たちは、創造性の感情的、象徴的、文化的、倫理的次元を捉えた12の特徴を定義します。
環境対話性や空洞アークといったトラストは高い信頼性で予測される。
私たちの研究は、文化的・美的な洞察と計算モデリングを結びつけることで、創造性を数字に還元するのではなく、アーティスト、研究者、AIシステムが有意義に協力するための共通の言語と解釈可能なツールを提供することを目的としています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a psychologically grounded and artist-informed framework for modeling visual creativity across four domains: Inner, Outer, Imaginative, and Moral Worlds. Drawing on interviews with practicing artists and theories from psychology, we define 12 traits that capture affective, symbolic, cultural, and ethical dimensions of creativity.Using 20k artworks from the SemArt dataset, we annotate images with GPT 4.1 using detailed, theory-aligned prompts, and evaluate the learnability of these traits from CLIP image embeddings. Traits such as Environmental Dialogicity and Redemptive Arc are predicted with high reliability ($R^2 \approx 0.64 - 0.68$), while others like Memory Imprint remain challenging, highlighting the limits of purely visual encoding. Beyond technical metrics, we visualize a "creativity trait-space" and illustrate how it can support interpretable, trait-aware co-creation - e.g., sliding along a Redemptive Arc axis to explore works of adversity and renewal. By linking cultural-aesthetic insights with computational modeling, our work aims not to reduce creativity to numbers, but to offer shared language and interpretable tools for artists, researchers, and AI systems to collaborate meaningfully.
- Abstract(参考訳): 本研究では,内的,外的,内的,道徳的世界という4つの領域にまたがって,視覚的創造性をモデル化するための心理的基盤と芸術的インフォームド・フレームワークを紹介する。
心理学からアーティストや理論を実践する際のインタビューに基づいて,創造性の感情的,象徴的,文化的,倫理的次元を捉えた12の特徴を定義し,SemArtデータセットから20kのアートワークを用いて,詳細な理論的なプロンプトを用いてGPT 4.1で画像に注釈を付け,CLIP画像埋め込みからこれらの特徴の学習性を評価する。
R^2 \approx 0.64 - 0.68$) や、メモリインプリント(Memory Imprint)など、純粋な視覚的エンコーディングの限界を強調しながら、環境的ダイアロジシティや冗長アークといったトラストは高い信頼性で予測される(R^2 \approx 0.64 - 0.68$)。
技術的メトリクス以外にも,“創造的な特性空間”を視覚化して,解釈可能な特性認識のコクリエーション – 例えば,Redemptive Arc軸に沿ってスライドして,逆境と更新の作業を探索する — をサポートする方法について説明しています。
私たちの研究は、文化的・美的な洞察と計算モデリングを結びつけることで、創造性を数字に還元するのではなく、アーティスト、研究者、AIシステムが有意義に協力するための共通の言語と解釈可能なツールを提供することを目的としています。
関連論文リスト
- Does CLIP perceive art the same way we do? [0.0]
絵画から高レベルの意味情報や文体情報を抽出するCLIPの能力について検討する。
以上の結果から,CLIPの視覚的表現の長所と短所が明らかとなった。
我々の研究は、マルチモーダルシステムにおけるより深い解釈可能性の必要性を強調している。
論文 参考訳(メタデータ) (2025-05-08T13:21:10Z) - Compose Your Aesthetics: Empowering Text-to-Image Models with the Principles of Art [61.28133495240179]
本稿では,ユーザが特定した美学をT2I生成出力と整合させることを目的とした,美学アライメントの新しい課題を提案する。
アートワークが美学にアプローチするための貴重な視点を提供する方法にインスパイアされた私たちは、構成的枠組みのアーティストが採用する視覚的美学を定式化した。
我々は,T2I DMが,ユーザが特定したPoA条件により10の合成制御を効果的に提供することを実証した。
論文 参考訳(メタデータ) (2025-03-15T06:58:09Z) - Pencils to Pixels: A Systematic Study of Creative Drawings across Children, Adults and AI [0.0]
子ども、大人、AIによる1338の図面を創造的な図面タスクで分析する。
スタイルとしては,インク密度,インク分布,元素数などを定義している。
コンテンツについては、専門家が注釈付けしたカテゴリを使用して概念的多様性を研究します。
専門家と自動化されたクリエイティビティスコアを予測するシンプルなモデルを構築します。
論文 参考訳(メタデータ) (2025-02-09T19:02:32Z) - Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。
我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。
本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文 参考訳(メタデータ) (2024-11-18T11:55:38Z) - Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.345344799258804]
本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。
2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。
このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文 参考訳(メタデータ) (2024-10-27T14:27:05Z) - Computational Modeling of Artistic Inspiration: A Framework for Predicting Aesthetic Preferences in Lyrical Lines Using Linguistic and Stylistic Features [8.205321096201095]
芸術的なインスピレーションは、観客に深く響く作品を作る上で重要な役割を担っている。
この研究は、異なる個人における芸術的嗜好を計算的にモデル化するための新しい枠組みを提案する。
我々のフレームワークは、最先端のオープンソース言語モデルであるLLaMA-3-70bを18ポイント近く上回っている。
論文 参考訳(メタデータ) (2024-10-03T18:10:16Z) - Diffusion-Based Visual Art Creation: A Survey and New Perspectives [51.522935314070416]
本調査は,拡散に基づく視覚芸術創造の新たな領域を探求し,その発展を芸術的,技術的両面から検討する。
本研究は,芸術的要件が技術的課題にどのように変換されるかを明らかにし,視覚芸術創造における拡散法の設計と応用を強調した。
我々は、AIシステムが芸術的知覚と創造性において人間の能力をエミュレートし、潜在的に増強するメカニズムに光を当てることを目指している。
論文 参考訳(メタデータ) (2024-08-22T04:49:50Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Graph Neural Networks for Knowledge Enhanced Visual Representation of Paintings [12.724750260261066]
ArtSAGENetは、グラフニューラルネットワーク(GNN)と畳み込みニューラルネットワーク(CNN)を統合する新しいアーキテクチャである。
提案したArtSAGENetは,アーティストとアートワーク間の重要な依存関係をキャプチャし,エンコードする。
本研究は,美術品分析とキュレーションのための視覚コンテンツとセマンティクスの統合の可能性について考察した。
論文 参考訳(メタデータ) (2021-05-17T23:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。