論文の概要: Reproducibility Study of "Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents"
- arxiv url: http://arxiv.org/abs/2505.09289v1
- Date: Wed, 14 May 2025 11:15:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.431056
- Title: Reproducibility Study of "Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents"
- Title(参考訳): LLMエージェント学会における「協力・崩壊・持続的協力の創発」の再現性に関する研究
- Authors: Pedro M. P. Curvo, Mara Dragomir, Salvador Torpes, Mohammadmahdi Rahimi,
- Abstract要約: GovSimは、リソース共有シナリオにおける大規模言語モデル(LLM)の協調的意思決定能力を評価するために設計されたシミュレーションフレームワークである。
我々は,GPT-4-turboのような大型モデルの性能に関する主張を,小型モデルと比較して検証した。
その結果、大規模モデルは、普遍化原理の有無にかかわらず、持続的な協力を達成できる一方で、より小さなモデルはそれなしで失敗できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study evaluates and extends the findings made by Piatti et al., who introduced GovSim, a simulation framework designed to assess the cooperative decision-making capabilities of large language models (LLMs) in resource-sharing scenarios. By replicating key experiments, we validate claims regarding the performance of large models, such as GPT-4-turbo, compared to smaller models. The impact of the universalization principle is also examined, with results showing that large models can achieve sustainable cooperation, with or without the principle, while smaller models fail without it. In addition, we provide multiple extensions to explore the applicability of the framework to new settings. We evaluate additional models, such as DeepSeek-V3 and GPT-4o-mini, to test whether cooperative behavior generalizes across different architectures and model sizes. Furthermore, we introduce new settings: we create a heterogeneous multi-agent environment, study a scenario using Japanese instructions, and explore an "inverse environment" where agents must cooperate to mitigate harmful resource distributions. Our results confirm that the benchmark can be applied to new models, scenarios, and languages, offering valuable insights into the adaptability of LLMs in complex cooperative tasks. Moreover, the experiment involving heterogeneous multi-agent systems demonstrates that high-performing models can influence lower-performing ones to adopt similar behaviors. This finding has significant implications for other agent-based applications, potentially enabling more efficient use of computational resources and contributing to the development of more effective cooperative AI systems.
- Abstract(参考訳): 資源共有シナリオにおける大規模言語モデル(LLM)の協調的意思決定能力を評価するためのシミュレーションフレームワークであるGovSimを導入したPiattiらによる調査結果を評価し,拡張する。
GPT-4-turboのような大規模モデルの性能に関する主張を,より小さなモデルと比較して再現することによって検証する。
普遍化原理の影響についても検討し、より小さなモデルでは失敗する一方、大きなモデルでは原則の有無にかかわらず、持続可能な協調が達成できることを示した。
さらに、新しい設定へのフレームワークの適用性を探るため、複数の拡張も提供しています。
我々は,DeepSeek-V3 や GPT-4o-mini などの追加モデルを評価し,協調行動が異なるアーキテクチャやモデルサイズにまたがって一般化するかどうかを検証する。
さらに、異種マルチエージェント環境を作成し、日本語の指示を用いてシナリオを学習し、有害な資源分布を緩和するためにエージェントが協力しなくてはならない「逆環境」を探索する。
このベンチマークは, 複雑な協調作業におけるLLMの適応性に関する貴重な知見を提供するため, 新たなモデル, シナリオ, 言語に適用可能であることを確認した。
さらに, 異種マルチエージェントシステムを用いた実験により, 高い性能モデルが低性能モデルに影響を及ぼし, 同様の挙動をとることを示した。
この発見は、他のエージェントベースのアプリケーションに重要な意味を持ち、より効率的な計算資源の使用を可能にし、より効果的な協調AIシステムの開発に寄与する可能性がある。
関連論文リスト
- A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文 参考訳(メタデータ) (2024-11-20T20:38:56Z) - On the Modeling Capabilities of Large Language Models for Sequential Decision Making [52.128546842746246]
大規模な事前訓練されたモデルでは、推論や計画タスクのパフォーマンスがますます向上している。
我々は、直接的または間接的に、意思決定ポリシーを作成する能力を評価する。
未知の力学を持つ環境において、合成データを用いた微調整LDMが報酬モデリング能力を大幅に向上させる方法について検討する。
論文 参考訳(メタデータ) (2024-10-08T03:12:57Z) - MultiAgent Collaboration Attack: Investigating Adversarial Attacks in Large Language Model Collaborations via Debate [24.92465108034783]
大規模言語モデル(LLM)は、個別に作業する場合に、現在のベンチマークで例外的な結果を示す。
パラメータサイズと推論時間の短縮とともに、それらの能力の進歩は、これらのモデルをエージェントとしての使用を促進する。
敵の影響下での議論を通じて協調するモデルのネットワークの挙動を評価する。
論文 参考訳(メタデータ) (2024-06-20T20:09:37Z) - Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - Can LLM-Augmented autonomous agents cooperate?, An evaluation of their cooperative capabilities through Melting Pot [2.3732649191362483]
本稿では,よく知られたメルチンポット環境を用いた大規模言語モデル拡張自律エージェント(LAA)の協調機能について検討する。
研究のコントリビューションには、LLMにメルティングポットゲームシナリオを適用するための抽象化レイヤが含まれている。
Melting Potの"Commons Harvest"ゲームに関連するメトリクスのセットを用いた協調機能の評価。
論文 参考訳(メタデータ) (2024-03-18T00:13:43Z) - Leveraging World Model Disentanglement in Value-Based Multi-Agent
Reinforcement Learning [18.651307543537655]
本稿では,Distangled World Modelを用いた新しいモデルベースマルチエージェント強化学習手法であるValue Decomposition Frameworkを提案する。
本研究では,本手法が高サンプリング効率を実現し,敵軍を撃破する性能が他のベースラインよりも優れていることを示すために,簡単な,ハード,スーパーハードのStarCraft IIマイクロマネジメントの課題について実験的に検討した。
論文 参考訳(メタデータ) (2023-09-08T22:12:43Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise
Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。
AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文 参考訳(メタデータ) (2021-05-07T16:20:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。