論文の概要: Shapley-Coop: Credit Assignment for Emergent Cooperation in Self-Interested LLM Agents
- arxiv url: http://arxiv.org/abs/2506.07388v1
- Date: Mon, 09 Jun 2025 03:24:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.792191
- Title: Shapley-Coop: Credit Assignment for Emergent Cooperation in Self-Interested LLM Agents
- Title(参考訳): Shapley-Coop:自己関心LLMエージェントの創発的協力のためのクレジットアサインメント
- Authors: Yun Hua, Haosheng Chen, Shiqin Wang, Wenhao Li, Xiangfeng Wang, Jun Luo,
- Abstract要約: 大規模言語モデル(LLM)は、事前に定義された役割と役割を持つマルチエージェントシステムにおいて、強力な協調的なパフォーマンスを示す。
コーディネーションの 中心的な課題は 信用の割り当てにある
Shagley-CoopはShapley Chain-of-Thoughtを効果的な価格マッチングのための構造化プロトコルに統合する。
- 参考スコア(独自算出の注目度): 19.76624432791744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) show strong collaborative performance in multi-agent systems with predefined roles and workflows. However, in open-ended environments lacking coordination rules, agents tend to act in self-interested ways. The central challenge in achieving coordination lies in credit assignment -- fairly evaluating each agent's contribution and designing pricing mechanisms that align their heterogeneous goals. This problem is critical as LLMs increasingly participate in complex human-AI collaborations, where fair compensation and accountability rely on effective pricing mechanisms. Inspired by how human societies address similar coordination challenges (e.g., through temporary collaborations such as employment or subcontracting), we propose a cooperative workflow, Shapley-Coop. Shapley-Coop integrates Shapley Chain-of-Thought -- leveraging marginal contributions as a principled basis for pricing -- with structured negotiation protocols for effective price matching, enabling LLM agents to coordinate through rational task-time pricing and post-task reward redistribution. This approach aligns agent incentives, fosters cooperation, and maintains autonomy. We evaluate Shapley-Coop across two multi-agent games and a software engineering simulation, demonstrating that it consistently enhances LLM agent collaboration and facilitates equitable credit assignment. These results highlight the effectiveness of Shapley-Coop's pricing mechanisms in accurately reflecting individual contributions during task execution.
- Abstract(参考訳): 大規模言語モデル(LLM)は、事前に定義された役割とワークフローを持つマルチエージェントシステムにおいて、強力な協調的なパフォーマンスを示す。
しかしながら、調整規則を欠いたオープンエンド環境では、エージェントは自己関心のある方法で行動する傾向がある。
調整の達成における中心的な課題は、クレジットの割り当てであり、各エージェントの貢献を評価し、不均一な目標を整合させる価格設定メカニズムを設計することである。
LLMは、公正な報酬と説明責任が効果的な価格設定機構に依存する複雑な人間とAIのコラボレーションにますます参加しているため、この問題は極めて重要である。
人間の社会は、雇用や下請けといった一時的なコラボレーションを通じて、同様の調整課題にどのように対処するかに触発され、協調的なワークフローであるShapley-Coopを提案する。
Shapley-CoopはShapley Chain-of-Thoughtを -- 限界貢献を価格の原則的基盤として活用する -- と効果的な価格設定のための構造化交渉プロトコルを統合し、合理的なタスクタイムの価格設定とポストタスク報酬の再分配を通じてLLMエージェントの調整を可能にする。
このアプローチはエージェントのインセンティブを一致させ、協力を促進し、自律性を維持する。
2つのマルチエージェントゲームとソフトウェアエンジニアリングシミュレーションでShapley-Coopを評価し、LLMエージェントの協調性を一貫して強化し、公平なクレジット割り当てを促進することを実証した。
これらの結果は、タスク実行中の個々のコントリビューションを正確に反映するShapley-Coopの価格設定メカニズムの有効性を強調した。
関連論文リスト
- COALESCE: Economic and Security Dynamics of Skill-Based Task Outsourcing Among Team of Autonomous LLM Agents [0.0]
COALESCEは、自律型大規模言語モデル(LLM)エージェントが特定のサブタスクを、特殊で費用対効果の高いサードパーティのLCMエージェントにアウトソースできるように設計された、新しいフレームワークである。
239の理論的シミュレーションによる総合的な検証は41.8%のコスト削減の可能性を示している。
240の実際のLCMタスクにわたる大規模な実証検証により、適切なエプシロン-グレディー探索によって20.3%のコスト削減が確認された。
論文 参考訳(メタデータ) (2025-06-02T17:22:47Z) - CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation [98.11670473661587]
CaPoは,1)メタプラン生成,2)プログレッシブなメタプランと実行の2つのフェーズで協調効率を向上する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
論文 参考訳(メタデータ) (2024-11-07T13:08:04Z) - Learning to Balance Altruism and Self-interest Based on Empathy in Mixed-Motive Games [47.8980880888222]
マルチエージェントのシナリオは、しばしば混合モチベーションを伴い、潜在的な搾取に対する自己保護が可能な利他的エージェントを要求する。
共感に基づくアルトリズムと自己利益のバランスをとるためのLASE学習を提案する。
LASEはその報酬の一部を共同プレイヤにギフトとして割り当て、このアロケーションは社会的関係に基づいて動的に適応する。
論文 参考訳(メタデータ) (2024-10-10T12:30:56Z) - CoMIX: A Multi-agent Reinforcement Learning Training Architecture for Efficient Decentralized Coordination and Independent Decision-Making [2.4555276449137042]
ロバストコーディネートスキルにより、エージェントは共有環境で、共通の目標に向けて、そして理想的には、お互いの進歩を妨げることなく、結合的に操作することができる。
本稿では,分散エージェントのための新しいトレーニングフレームワークであるCoordinated QMIXについて述べる。
論文 参考訳(メタデータ) (2023-08-21T13:45:44Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - Adaptive Value Decomposition with Greedy Marginal Contribution
Computation for Cooperative Multi-Agent Reinforcement Learning [48.41925886860991]
現実世界の協力はしばしばエージェント間の集中的な調整を必要とする。
単調なユーティリティの単調混合として値関数を学習する従来の方法は、非単調なリターンでタスクを解くことはできない。
非単調な問題に対処するための新しい明示的な信用割当手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T07:23:59Z) - Shapley Counterfactual Credits for Multi-Agent Reinforcement Learning [34.856522993714535]
本稿では,エージェントの連立性を考慮した明示的な信用割当手法であるシェープリー・カウンセリング・クレジット・アサインメントを提案する。
提案手法は,既存の協調型MARLアルゴリズムを著しく上回り,特に難易度の高いタスクにおいて,最先端のアルゴリズムを実現する。
論文 参考訳(メタデータ) (2021-06-01T07:38:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。