論文の概要: CREATE: Testing LLMs for Associative Creativity
- arxiv url: http://arxiv.org/abs/2603.09970v1
- Date: Tue, 10 Mar 2026 17:58:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.524247
- Title: CREATE: Testing LLMs for Associative Creativity
- Title(参考訳): CREATE: 連想創造性のためのLLMのテスト
- Authors: Manya Wadhwa, Tiasa Singha Roy, Harvey Lederman, Junyi Jessy Li, Greg Durrett,
- Abstract要約: 創造的連想的推論のためのモデルの能力を評価するためのベンチマークであるCREATEを紹介する。
最強のモデルが他のモデルよりも高い創造性を達成することを示す。
私たちの結果は、高いトークン予算であっても、思考モデルがタスクに対してより効果的であるとは限らないことを示しています。
- 参考スコア(独自算出の注目度): 51.64544603712446
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key component of creativity is associative reasoning: the ability to draw novel yet meaningful connections between concepts. We introduce CREATE, a benchmark designed to evaluate models' capacity for creative associative reasoning. CREATE requires models to generate sets of paths connecting concepts in a model's parametric knowledge. Paths should have high specificity (distinctiveness and closeness of the concept connection) and high diversity (dissimilarity from other paths), and models are scored more highly if they produce a larger set of strong, diverse paths. This task shares demands of real creativity tasks like hypothesis generation, including an extremely large search space, but enables collection of a sizable benchmark with objective answer grading. Evaluation of frontier models shows that the strongest models achieve higher creative utility than others, with the high multiplicity of answers and complexity of the search making benchmark saturation difficult to achieve. Furthermore, our results illustrate that thinking models are not always more effective on our task, even with high token budgets. Recent approaches for creative prompting give some but limited additional improvement. CREATE provides a sandbox for developing new methods to improve models' capacity for associative creativity.
- Abstract(参考訳): 創造性の重要な要素は連想的推論(asociative reasoning)である。
創造的連想的推論のためのモデルの能力を評価するためのベンチマークであるCREATEを紹介する。
CREATEはモデルのパラメトリック知識で概念を接続するパスセットを生成するためにモデルを必要とする。
パスは、高い特異性(概念接続の識別性と近接性)と高い多様性(他のパスと異なる)を持つべきである。
このタスクは、非常に大きな検索スペースを含む仮説生成のような現実的な創造性タスクの要求を共有するが、客観的な回答グレーディングを備えた巨大なベンチマークの収集を可能にする。
フロンティアモデルの評価は、最強モデルが他のモデルよりも高い創造性を達成することを示し、回答の多さと検索の複雑さは、ベンチマーク飽和を達成するのが困難であることを示している。
さらに、私たちの結果は、高いトークン予算であっても、思考モデルがタスクに対して常に効果的であるとは限らないことを示しています。
創造的なプロンプトに対する最近のアプローチは、いくつかの限定的な改善をもたらす。
CREATEは、連想的創造性のためのモデルの能力を改善する新しい方法を開発するためのサンドボックスを提供する。
関連論文リスト
- Beyond Divergent Creativity: A Human-Based Evaluation of Creativity in Large Language Models [6.036586911740041]
大規模言語モデル(LLM)は、言語的創造的なタスクにますます使われています。
広く使われているダイバージェント・アソシエーション・タスク(DAT)は、新規性を重視し、適切性を無視している。
DAT上での最先端のLCMの範囲を評価し、そのタスクにおけるスコアが、創造力を持たない2つのベースラインのスコアよりも低いことを示す。
論文 参考訳(メタデータ) (2026-01-28T12:41:32Z) - CreativityPrism: A Holistic Benchmark for Large Language Model Creativity [64.18257552903151]
創造性はしばしば人間の知能の目印と見なされる。
さまざまなシナリオにまたがってクリエイティビティを評価するための総合的なフレームワークはまだ存在しません。
本稿では,創造性を質,新規性,多様性の3次元に分解する評価分析フレームワークであるCreativePrismを提案する。
論文 参考訳(メタデータ) (2025-10-23T00:22:10Z) - Generative Modeling with Multi-Instance Reward Learning for E-commerce Creative Optimization [15.51942931334223]
eコマース広告では、創造的要素の最も説得力のある組み合わせを選択することが、ユーザの注意を引き、コンバージョンを推進するために重要である。
我々は、生成モデリングとマルチインスタンス報酬学習を統合したGenCOという新しいフレームワークを提案する。
われわれのアプローチは広告収入を大幅に増加させ、その実用的価値を示している。
論文 参考訳(メタデータ) (2025-08-13T11:53:41Z) - Cooking Up Creativity: Enhancing LLM Creativity through Structured Recombination [46.79423188943526]
本稿では,LLM(Large Language Models)の創造性を高める新しいアプローチを提案する。
自然言語と構造化表現の翻訳にLLMを適用し,その中心となる創造的飛躍を行う。
我々は、創造的なレシピを生成するモデルであるDishCOVERを用いて、料理分野における我々のアプローチを実証する。
論文 参考訳(メタデータ) (2025-04-29T11:13:06Z) - A Causality-aware Paradigm for Evaluating Creativity of Multimodal Large Language Models [100.16387798660833]
オオギリゲーム(オオギリゲーム)は、ユーモアと連想的思考を必要とする創造的な仕事である。
LoTbenchはインタラクティブで因果性を考慮した評価フレームワークである。
その結果、ほとんどのLLMは制約された創造性を示すが、LLMと人間の間の性能格差は克服できないことがわかった。
論文 参考訳(メタデータ) (2025-01-25T09:11:15Z) - Benchmarking Language Model Creativity: A Case Study on Code Generation [39.546827184857754]
本研究では,LLMの創造性を定量化するフレームワークを提案する。
生成した創造的応答における収束的思考と発散的思考の両方を定量化する計量であるNEOGAUGEを定義する。
我々はCodeforcesの問題に関する提案されたフレームワークをテストする。これは、タスクをコーディングするための自然なデータセットと、先行する人間のソリューションのコレクションの両方に役立ちます。
論文 参考訳(メタデータ) (2024-07-12T05:55:22Z) - Can AI Be as Creative as Humans? [84.43873277557852]
理論的には、AIは人間の創造者によって生成されたデータに適切に適合できるという条件の下で、人間と同じくらい創造的になれることを証明しています。
AIの創造性に関する議論は、十分な量のデータに適合する能力の問題に縮小されている。
論文 参考訳(メタデータ) (2024-01-03T08:49:12Z) - Luminate: Structured Generation and Exploration of Design Space with Large Language Models for Human-AI Co-Creation [19.62178304006683]
現在のインタラクションパラダイムは不足しており、限られたアイデアの集合に対して、ユーザを迅速なコンバージェンスへと導くものだ、と私たちは主張する。
本研究では,ユーザがシームレスに探索し,評価し,多数の応答を合成できる設計空間の構造化を促進するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T17:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。