論文の概要: Group Selection Promotes Prosocial Prompts in Populations of LLM Agents
- arxiv url: http://arxiv.org/abs/2606.23343v1
- Date: Mon, 22 Jun 2026 13:47:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:08:20.187455
- Title: Group Selection Promotes Prosocial Prompts in Populations of LLM Agents
- Title(参考訳): グループ選択はLLMエージェントの集団における社会的プロンプトを促進する
- Authors: Luis Celiktemel, Edward Eichhorn, Levin Brinkmann, Robin Schimmelpfennig, Aron Vallinder, Yaomin Jiang, Edward Hughes, Iyad Rahwan,
- Abstract要約: グループ選択は,大規模言語モデル(LLM)エージェントの集団における協調を促進することができるかを検討する。
グループ選択では、ハイパフォーマンスなグループからのプロンプトが送信され、それによって社会性の促進と協力の安定化が促進される。
予備的な発見は、選択メカニズムを知らせると、GPT-5.4は先制的に第1世代の寄付を徐々に調整することを示している。
- 参考スコア(独自算出の注目度): 1.7004466773233589
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Current approaches to instill prosociality in large language model (LLM) agents often rely on humans specifying desired behaviors at the individual level, which does not guarantee cooperation within LLM populations. As frontier training shifts toward individual rewards for verifiable tasks, such as mathematics and coding, this outcome-based focus may further undermine cooperation in multi-agent settings. Large-scale cooperation in human populations emerged via unguided evolutionary mechanisms, not a central architect. Group selection, in which cooperative groups within a population outcompete less cooperative ones, has been argued to be essential. In this study, we explore whether group selection can promote cooperation in populations of LLM agents. We introduce a multi-agent simulation framework in which LLM agents play a repeated social dilemma game and transmit their natural-language prompts across generations under either individual- or group-level selection. Under group selection, prompts from high-performing groups are transmitted, thereby promoting prosociality and stabilizing cooperation. Under individual selection, self-interested prompts dominate, causing populations to collapse into collective defection. This gap is robust across prompt ablations, alternative game framings, and model swaps. We theoretically reproduce key results using a replicator-mutator model, whose empirical transmission kernel predicts a phase transition at a critical threshold. Preliminary findings show that, when informed about the selection mechanism, GPT-5.4 preemptively and gradually adjusts first-generation donations. This demonstrates strong anticipatory behavior that was not observed in the other tested models. These results demonstrate that prosocial prompts and cooperative behaviors evolve in LLM agent populations under group selection.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントの社会性を高めるための現在のアプローチは、LLMの集団内での協力を保証しない、個々のレベルで望ましい行動を特定する人間に依存していることが多い。
数学やコーディングなどの検証可能なタスクに対して、フロンティアトレーニングが個々の報酬へとシフトするにつれ、この結果に基づく焦点は、マルチエージェント環境での協力をさらに損なう可能性がある。
人間の集団における大規模な協力は、中心的な建築家ではなく、誘導されていない進化のメカニズムによって生まれた。
集団選択は、集団内の協力集団がより協力的なグループよりも優れていると主張されている。
本研究では,グループ選択がLLMエージェントの集団における協調を促進できるかどうかを検討する。
LLMエージェントが繰り返しソーシャルジレンマゲームを行うマルチエージェントシミュレーションフレームワークを導入する。
グループ選択では、ハイパフォーマンスなグループからのプロンプトが送信され、それによって社会性の促進と協力の安定化が促進される。
個人の選択の下では、自己関心のプロンプトが支配的になり、人口は集団的な欠陥へと崩壊する。
このギャップは、プロンプトアブレーション、代替ゲームフレーミング、モデルスワップにまたがって堅牢である。
実験的な伝送カーネルが臨界閾値で位相遷移を予測するレプリカタ・ミュータモデルを用いて、理論的に鍵結果を再現する。
予備的な発見は、選択メカニズムを知らせると、GPT-5.4は先制的に第1世代の寄付を徐々に調整することを示している。
これは、他の試験モデルでは観測されなかった強い予測挙動を示す。
これらの結果は, グループ選択下でのLLMエージェント集団において, 社会的なプロンプトと協調行動が発達することを示した。
関連論文リスト
- MobEvolve: An Agentic Self-Evolving Heuristic System for Interpretable Human Mobility Generation [51.824145170051516]
MobEvolveは、人間のモビリティ生成のための自己進化フレームワークである。
エージェントを使用して、内部ロジックを反復的に進化させる。
最先端の深層生成法とLLMベースの手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-06-01T03:46:25Z) - Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems [65.90791804095561]
マルチエージェントシステムは、特殊エージェント間の構造化された協調を通じてこの問題に対処するが、より厳密な調整は、あまり検討されていないリスクを増幅する。
既存の調査では、個々のエージェント能力、マルチエージェントのコラボレーション、エージェントの自己進化を別々にカバーしている。
この調査は4つの因果関係のあるステージを中心にまとめられた統一されたレビューを提供する。これはLIFEの進展(Lay the capabilities foundation)、協力によるエージェントの統合、帰属による障害の発見、自律的な自己改善によるEvolveである。
論文 参考訳(メタデータ) (2026-05-14T14:36:13Z) - When Is Collective Intelligence a Lottery? Multi-Agent Scaling Laws for Memetic Drift in LLMs [19.42697228981973]
命名ゲームにおいて、特定のエージェントがラベルを優先しない場合でも、人口は急速に対称性を破り、コンセンサスに達することを示す。
最小限のモデルであるQuantized Simplex Gossip (QSG)を導入し、この合意の微妙な起源を相互文脈学習に追従するメカニズムを明らかにする。
我々は,人口規模,通信帯域幅,文脈内適応率,エージェントの内部不確実性の関数として,ドリフト誘起偏光のスケーリング法則を導出する。
論文 参考訳(メタデータ) (2026-03-25T18:00:29Z) - Learning Robust Social Strategies with Large Language Models [7.697496386429445]
強化学習は,大規模言語モデル(LLM)を単一エージェント体制で整列させるのに有効である。
マルチエージェント設定における標準RLは、しばしば欠陥のある自己関心のポリシーに収束することを示す。
RLが不均衡に収束する傾向に対処するため、近年の対向学習認識アルゴリズムAdvantage Alignmentを適用した。
論文 参考訳(メタデータ) (2025-11-24T18:43:46Z) - CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards [80.78748457530718]
自己進化(Self-evolution)は、大規模言語モデル(LLM)ベースのエージェントが事前トレーニング後の能力を継続的に改善できるようにする上で、中心的な研究トピックである。
エージェントがエージェント間相互作用から学習することで自律的に改善できる新しいフレームワークであるCo-Evolving Multi-Agent Systems (CoMAS)を紹介する。
論文 参考訳(メタデータ) (2025-10-09T17:50:26Z) - Prompt Optimization Across Multiple Agents for Representing Diverse Human Populations [24.453294687297984]
本研究では,特定の個体群の多様性を総合的に把握するエージェント群を構築するための枠組みを提案する。
それぞれのエージェントは、人間のデモの小さなセットを条件付けすることで行動が制御されるLSMである。
提案手法は,ヒトの集団をベースラインよりも効果的に表現するエージェントを構築できることを示す。
論文 参考訳(メタデータ) (2025-10-08T14:28:53Z) - Emergent Coordination in Multi-Agent Language Models [2.504366738288215]
マルチエージェントシステムが高次構造の兆候を示すかどうかをテストするための情報理論フレームワークを提案する。
この情報分解により、マルチエージェントLLMシステムに動的に出現するかどうかを測定することができる。
我々は,エージェントの直接通信を使わずに,単純な推測ゲームを用いた実験に本フレームワークを適用した。
論文 参考訳(メタデータ) (2025-10-05T11:26:41Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - HiddenBench: Assessing Collective Reasoning in Multi-Agent LLMs via Hidden Profile Tasks [12.203366267017737]
マルチエージェント LLM における集合的推論を評価するための最初のベンチマークである HiddenBench を紹介する。
ベンチマークを基礎として,このパラダイムをカスタムタスクで形式化し,GPT-4.1グループが分散知識の統合に失敗したことを示す。
次に、カスタムデザイン、先行研究、自動生成から引き出された65のタスクにまたがる完全なベンチマークを構築します。
論文 参考訳(メタデータ) (2025-05-15T19:22:54Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。