論文の概要: Stable diffusion models reveal a persisting human and AI gap in visual creativity
- arxiv url: http://arxiv.org/abs/2511.16814v1
- Date: Thu, 20 Nov 2025 21:33:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:18.814114
- Title: Stable diffusion models reveal a persisting human and AI gap in visual creativity
- Title(参考訳): 安定した拡散モデルが視覚的創造性に持続する人間とAIのギャップを浮き彫りに
- Authors: Silvia Rondini, Claudia Alvarez-Martin, Paula Angermair-Barkai, Olivier Penacchio, M. Paz, Matthew Pelowski, Dan Dediu, Antoni Rodriguez-Fornells, Xim Cerda-Company,
- Abstract要約: 本研究では、画像生成AIモデルを用いて、人間の参加者(ビジュアルアーティストとノンアーティスト)のイメージ生成を比較した。
クリエイティビティのグラデーションは明確で、Visual Artistsが最もクリエイティブでした。
人間とAIのトレーナーも、クリエイティビティの判断パターンを大きく変えた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While recent research suggests Large Language Models match human creative performance in divergent thinking tasks, visual creativity remains underexplored. This study compared image generation in human participants (Visual Artists and Non Artists) and using an image generation AI model (two prompting conditions with varying human input: high for Human Inspired, low for Self Guided). Human raters (N=255) and GPT4o evaluated the creativity of the resulting images. We found a clear creativity gradient, with Visual Artists being the most creative, followed by Non Artists, then Human Inspired generative AI, and finally Self Guided generative AI. Increased human guidance strongly improved GenAI's creative output, bringing its productions close to those of Non Artists. Notably, human and AI raters also showed vastly different creativity judgment patterns. These results suggest that, in contrast to language centered tasks, GenAI models may face unique challenges in visual domains, where creativity depends on perceptual nuance and contextual sensitivity, distinctly human capacities that may not be readily transferable from language models.
- Abstract(参考訳): 最近の研究では、大きな言語モデルは異なる思考タスクにおける人間の創造的パフォーマンスにマッチするが、視覚的創造性は未解明のままである。
本研究では,人間の参加者(ビジュアルアーティストと非アーティスト)における画像生成と画像生成AIモデル(人間のインプットが変化する2つの条件:人間にインスパイアされた場合,自己ガイドが低い場合)の比較を行った。
人間のラッカー(N=255)とGPT4oは、得られた画像の創造性を評価した。
視覚アーチストが最も創造的であり、次にNon Artists、次にHuman Inspireed Generative AI、そして最後にSelf Guided Generative AIが続いた。
人的指導の強化は、GenAIの創造的アウトプットを強く改善し、Non Artistsに近くなった。
とくに、人間とAIのラテンダーたちは、創造性の判断パターンを大きく変えた。
これらの結果は、言語中心のタスクとは対照的に、創造性は知覚的ニュアンスと文脈的感度に依存し、言語モデルから容易に移行できない人間の能力に依存する、視覚領域においてユニークな課題に直面する可能性があることを示唆している。
関連論文リスト
- Expertise elevates AI usage: experimental evidence comparing laypeople and professional artists [1.5296069874080693]
生成AIを用いて芸術家と一般人の芸術的能力を比較する。
平均して、アーティストは彼らの通常の作品よりも忠実でクリエイティブなアウトプットを生み出した。
AIはコンテンツ作成を楽にするかもしれないが、専門家の専門知識は依然として価値がある。
論文 参考訳(メタデータ) (2025-01-21T18:53:21Z) - Creativity in AI: Progresses and Challenges [17.03526787878041]
我々は,AIシステムの創造的能力について研究し,創造的な問題解決,言語的,芸術的,科学的創造性に注目した。
我々のレビューは、最新のAIモデルは言語的にも芸術的にも創造的なアウトプットを生成できるが、創造的な問題解決を必要とするタスクに苦労していることを示唆している。
プロセス駆動型で創造性のいくつかの側面を考慮した、包括的な創造性評価の必要性を強調します。
論文 参考訳(メタデータ) (2024-10-22T17:43:39Z) - Can AI Enhance its Creativity to Beat Humans ? [0.0]
本研究では,人間に対する人工知能(AI)の創造的性能について検討した。
人間の外部評価者は、人間とAIによって生成された創造的なアウトプットを収集した。
結果は、AIの創造的ポテンシャルを最大化するために、人間のフィードバックを統合することが重要であることを示唆している。
論文 参考訳(メタデータ) (2024-09-27T14:19:07Z) - On the stochastics of human and artificial creativity [0.0]
コンピュータにおける人間レベルの知性を達成するためには、人間レベルの創造性も必要である、と我々は主張する。
我々は、理論、心理学、哲学、神経科学、カオス理論からの事前の洞察を取り入れて、人間の創造性を統計的に表現する。
私たちの分析には、強化学習や拡散モデル、大規模言語モデルといった最新のAIアルゴリズムが含まれています。
論文 参考訳(メタデータ) (2024-03-03T10:38:57Z) - Can AI Be as Creative as Humans? [84.43873277557852]
理論的には、AIは人間の創造者によって生成されたデータに適切に適合できるという条件の下で、人間と同じくらい創造的になれることを証明しています。
AIの創造性に関する議論は、十分な量のデータに適合する能力の問題に縮小されている。
論文 参考訳(メタデータ) (2024-01-03T08:49:12Z) - Exploration with Principles for Diverse AI Supervision [88.61687950039662]
次世代の予測を用いた大規模トランスフォーマーのトレーニングは、AIの画期的な進歩を生み出した。
この生成AIアプローチは印象的な結果をもたらしたが、人間の監督に大きく依存している。
この人間の監視への強い依存は、AIイノベーションの進歩に重大なハードルをもたらす。
本稿では,高品質なトレーニングデータを自律的に生成することを目的とした,探索型AI(EAI)という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:03:39Z) - Telling Creative Stories Using Generative Visual Aids [52.623545341588304]
私たちはライターに、開始プロンプトからクリエイティブなストーリーを書くように頼み、同じプロンプトから生成するAIモデルによって生成されたビジュアルを提供した。
コントロールグループと比較すると、ビジュアルをストーリー・ライティング・アシストとして使用した作家は、より創造的で、オリジナルで、完全で、視覚的にできるストーリーを著した。
発見は、AIによる横断的なモダリティ入力は、人間とAIの共創において創造性の異なる側面に利益をもたらすが、収束する思考を妨げることを示している。
論文 参考訳(メタデータ) (2021-10-27T23:13:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。