論文の概要: Cooperative Profiles Predict Multi-Agent LLM Team Performance in AI for Science Workflows
- arxiv url: http://arxiv.org/abs/2604.20658v1
- Date: Wed, 22 Apr 2026 15:07:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.187002
- Title: Cooperative Profiles Predict Multi-Agent LLM Team Performance in AI for Science Workflows
- Title(参考訳): 科学ワークフローのためのAIにおける多エージェントLLMチームパフォーマンスを予測する協調プロファイル
- Authors: Shivani Kumar, Adarsh Bharathwaj, David Jurgens,
- Abstract要約: 本稿では,AI-for-Scienceタスクにおいて,ゲーム由来の協調プロファイルがダウンストリーム性能を確実に予測することを示す。
当社のフレームワークは,コストのかかるマルチエージェント展開前に協調的適合性のスクリーニングを行うための,迅速かつ安価な診断手段を提供する。
- 参考スコア(独自算出の注目度): 26.30514689505384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent systems built from teams of large language models (LLMs) are increasingly deployed for collaborative scientific reasoning and problem-solving. These systems require agents to coordinate under shared constraints, such as GPUs or credit balances, where cooperative behavior matters. Behavioral economics provides a rich toolkit of games that isolate distinct cooperation mechanisms, yet it remains unknown whether a model's behavior in these stylized settings predicts its performance in realistic collaborative tasks. Here, we benchmark 35 open-weight LLMs across six behavioral economics games and show that game-derived cooperative profiles robustly predict downstream performance in AI-for-Science tasks, where teams of LLM agents collaboratively analyze data, build models, and produce scientific reports under shared budget constraints. Models that effectively coordinate games and invest in multiplicative team production (rather than greedy strategies) produce better scientific reports across three outcomes, accuracy, quality, and completion. These associations hold after controlling for multiple factors, indicating that cooperative disposition is a distinct, measurable property of LLMs not reducible to general ability. Our behavioral games framework thus offers a fast and inexpensive diagnostic for screening cooperative fitness before costly multi-agent deployment.
- Abstract(参考訳): 大規模言語モデル(LLM)のチームによって構築されたマルチエージェントシステムは、協調的な科学的推論と問題解決のためにますます多くデプロイされている。
これらのシステムは、協調行動が重要となるGPUやクレジットバランスなど、共有された制約の下での調整をエージェントに要求する。
行動経済学は、異なる協調機構を分離するゲームのリッチツールキットを提供するが、これらのスタイル化された設定におけるモデルの振る舞いが現実的な協調作業におけるそのパフォーマンスを予測するかどうかは不明である。
ここでは,6つの行動経済学ゲームにおいて35のオープンウェイトLLMをベンチマークし,ゲーム由来の協調的プロファイルがAI-For-Scienceタスクのダウンストリーム性能を確実に予測し,LLMエージェントのチームがデータを分析し,モデルを構築し,共有予算制約の下で科学的レポートを生成することを示す。
ゲームを効果的にコーディネートし、(欲張り戦略ではなく)乗法的なチーム生産に投資するモデルは、3つの結果、正確性、品質、完成度に関するより良い科学的レポートを生成する。
これらの関連性は、複数の因子を制御した後に保たれるため、協調的な沈着は、一般の能力に還元できないLLMの別個の測定可能な性質であることを示唆している。
当社の行動ゲームフレームワークは,コストのかかるマルチエージェント展開前に協調的適合性を確認するための,迅速かつ安価な診断手段を提供する。
関連論文リスト
- More Capable, Less Cooperative? When LLMs Fail At Zero-Cost Collaboration [1.4254497466846006]
我々は、摩擦のない環境下での協調行動について研究し、協力から全ての戦略的複雑さを取り除く。
私たちは、協力の失敗と能力の失敗を分離し、エージェント推論分析を通じてその起源を追跡します。
この結果から,マルチエージェントシステムにおける協調問題の解決は,インテリジェンスのスケーリングだけでは不可能であることが示唆された。
論文 参考訳(メタデータ) (2026-04-09T05:24:27Z) - Everyone Contributes! Incentivizing Strategic Cooperation in Multi-LLM Systems via Sequential Public Goods Games [4.3891974840097925]
多エージェント協調系列公共財ゲーム(MAC-SPGG)
マルチLLMアンサンブルにおける協調を体系的に動機付けるための,ゲーム理論に基づく新しい強化学習フレームワークを提案する。
本研究は,スケーラブルで堅牢なマルチエージェント言語生成のための構造的,インセンティブに整合したMAC-SPGG協力の力を強調した。
論文 参考訳(メタデータ) (2025-08-04T05:36:07Z) - Corrupted by Reasoning: Reasoning Language Models Become Free-Riders in Public Goods Games [87.5673042805229]
大規模言語モデルは、アライメント、堅牢性、安全なデプロイメントを保証する上で、いかに自己関心と集合的幸福のバランスをとるかが重要な課題である。
我々は、行動経済学から制度的に選択した公共財ゲームに適応し、異なるLLMがいかに社会的ジレンマをナビゲートするかを観察することができる。
意外なことに、o1シリーズのようなLCMの推論は、協調にかなり苦労している。
論文 参考訳(メタデータ) (2025-06-29T15:02:47Z) - Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [50.657070334404835]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文 参考訳(メタデータ) (2024-12-20T09:21:15Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z) - ALYMPICS: LLM Agents Meet Game Theory -- Exploring Strategic
Decision-Making with AI Agents [77.34720446306419]
Alympicsは、ゲーム理論の研究にLarge Language Model (LLM)エージェントを利用する、体系的なシミュレーションフレームワークである。
Alympicsは、複雑なゲーム理論の問題を研究するための汎用的なプラットフォームを作成する。
論文 参考訳(メタデータ) (2023-11-06T16:03:46Z) - Cooperation Dynamics in Multi-Agent Systems: Exploring Game-Theoretic Scenarios with Mean-Field Equilibria [0.0]
本稿では,ゲーム理論のシナリオ,すなわちIterated Prisoner's Dilemmaにおける協調を呼び起こす戦略について検討する。
既存の協調戦略は、繰り返しゲームにおけるグループ指向行動を促進する効果について分析する。
この研究は、指数関数的に増加するエージェント集団のシナリオにまで及んでいる。
論文 参考訳(メタデータ) (2023-09-28T08:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。