論文の概要: Multi-agent AI systems outperform human teams in creativity
- arxiv url: http://arxiv.org/abs/2605.17885v1
- Date: Mon, 18 May 2026 05:52:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.898157
- Title: Multi-agent AI systems outperform human teams in creativity
- Title(参考訳): マルチエージェントAIシステムは創造性で人間チームを上回っている
- Authors: Tiancheng Hu, Yixuan Jiang, Haotian Li, José Hernández-Orallo, Xing Xie, Nigel Collier, David Stillwell, Luning Sun,
- Abstract要約: 大規模言語モデル(LLM)は、研究やイノベーションにおいてますます採用されている。
ここでは、マルチエージェントのLLMチームが、創造性において人間チームよりも大幅に優れています。
この利点は、同等の有用性を維持しながら、斬新さによって引き起こされる。
- 参考スコア(独自算出の注目度): 55.46056199651459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although artificial intelligence (AI) now matches or exceeds human performance across numerous cognitive tasks, creativity remains a highly contested frontier. As AI systems based on large language models (LLMs) are increasingly adopted in research and innovation, it is essential to understand and augment their creativity. Here we demonstrate that multi-agent LLM teams not only surpass single agents, but also substantially outperform human teams in creativity (Cohen's d=1.50) across 4,541 multi-agent LLM ideas and 341 human-team ideas on six diverse problem-solving tasks. This advantage is driven by novelty while maintaining comparable usefulness. To investigate the generative processes in both groups, we represent conversations as paths through semantic space using neural language model representations. Both LLM and human teams produce more creative ideas when conversations range widely rather than staying centered on a single theme (low global coherence). However, the additional patterns that predict creativity differ: LLM teams benefit from efficient exploration (high semantic spread, shorter paths), while human teams benefit from maintaining smooth conversational flow (high local coherence, frequent pivots). Additionally, we identify model choice and discussion structure as orthogonal design levers that together explain 26.8% of variance in LLM conversational dynamics, paving the way for systematic approaches to developing multi-agent systems with augmented creative capabilities.
- Abstract(参考訳): 人工知能(AI)は現在、多くの認知的タスクにおいて人間のパフォーマンスと一致するか上回っているが、創造性は競争の激しいフロンティアである。
大規模言語モデル(LLM)に基づくAIシステムは、研究やイノベーションにおいてますます採用されているため、創造性を理解し、強化することが不可欠である。
ここでは,マルチエージェントLLMチームが単一エージェントを超えるだけでなく,4,541のマルチエージェントLLMアイデアと6つの多様な問題解決タスクに関する341のヒューマンチームアイデアに対して,創造性(Cohen's d=1.50)において人間チームよりもはるかに優れています。
この利点は、同等の有用性を維持しながら、斬新さによって引き起こされる。
両グループの生成過程を調べるため,ニューラルネットワークモデル表現を用いて,会話を意味空間を通した経路として表現する。
LLMとヒューマンチームは、単一のテーマ(世界全体の一貫性の低い)に集中するよりも、会話が広い範囲で広まれば、より創造的なアイデアを生み出します。
LLMチームは効率的な探索(高いセマンティックスプレッド、短いパス)の恩恵を受ける一方、ヒューマンチームはスムーズな会話の流れ(高い局所コヒーレンス、頻繁なピボット)の恩恵を受ける。
さらに、モデル選択と議論構造を直交設計レバーとして認識し、LLMの会話力学における分散の26.8%を同時に説明し、拡張創造能力を持つマルチエージェントシステムを開発するための体系的なアプローチの道を開く。
関連論文リスト
- Small Language Models are the Future of Agentic AI [42.62162575221445]
スモールランゲージモデル(SLM)は十分に強力であり、本質的にはより適しており、エージェントシステムにおける多くの呼び出しに対して経済的である。
本稿では,エージェントシステムにおけるSLM導入の潜在的な障壁について論じ,汎用LLM-to-SLMエージェント変換アルゴリズムの概要を述べる。
論文 参考訳(メタデータ) (2025-06-02T18:35:16Z) - Humanlike Cognitive Patterns as Emergent Phenomena in Large Language Models [2.9312156642007294]
我々は、意思決定バイアス、推論、創造性の3つの重要な認知領域にわたって、大規模言語モデルの能力を体系的にレビューする。
意思決定では、LSMはいくつかの人間のようなバイアスを示すが、人間の観察するバイアスは欠落している。
GPT-4のような先進的なLCMは、人間のシステム2思考に似た熟考的推論を示し、小さなモデルは人間レベルの性能に欠ける。
LLMはストーリーテリングのような言語ベースの創造的なタスクに優れているが、現実の文脈を必要とする散発的な思考タスクに苦労する。
論文 参考訳(メタデータ) (2024-12-20T02:26:56Z) - Large Language Models show both individual and collective creativity comparable to humans [39.90254321453145]
大きな言語モデル(LLM)は人間に匹敵する創造性を示している。
我々は、LLMを個々の人間に対してベンチマークし、それらを人間の集団の創造性と比較することで、新しいアプローチをとる。
10回質問された場合、LCMの集団的創造性は8~10人の人間と同等である。
論文 参考訳(メタデータ) (2024-12-04T09:18:54Z) - Divergent Creativity in Humans and Large Language Models [37.67363469600804]
大きな言語モデル(LLM)は、人間の能力に似た創造性レベルに近づいていると主張している。
我々は最近の計算創造性の進歩を利用して、最先端のLLMと10万人の人間のデータセットのセマンティックな相違を分析する。
我々は, LLMがダイバージェント・アソシエーション・タスクにおいて, 平均的人的パフォーマンスを上回り, 人間の創造的筆記能力にアプローチできる証拠を見出した。
論文 参考訳(メタデータ) (2024-05-13T22:37:52Z) - Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration [83.4031923134958]
Corexは,大規模言語モデルを自律エージェントに変換する,新たな汎用戦略スイートだ。
人間の振る舞いにインスパイアされたCorexは、Debate、Review、Retrieveモードといった多様なコラボレーションパラダイムによって構成されている。
我々は,複数のLDMを協調的に演奏することで,既存の手法に比べて性能が著しく向上することが実証された。
論文 参考訳(メタデータ) (2023-09-30T07:11:39Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。