論文の概要: Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches
- arxiv url: http://arxiv.org/abs/2510.05748v1
- Date: Tue, 07 Oct 2025 10:06:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.194248
- Title: Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches
- Title(参考訳): LLMエージェントにおけるコミュニケーションの協調性:カリキュラムベースアプローチとの比較
- Authors: Hachem Madmoun, Salem Lahlou,
- Abstract要約: 4人のプレイヤーであるスタッグハントでは、1ワードの「チープトーク」チャンネルが0%から48.3%に協力を拡大している。
カリキュラム学習は設計選択に非常に敏感であることがわかった。
- 参考スコア(独自算出の注目度): 4.327553572272616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Eliciting cooperation in multi-agent LLM systems is critical for AI alignment. We investigate two approaches: direct communication and curriculum learning. In a 4-player Stag Hunt, a one-word "cheap talk" channel increases cooperation from 0% to 48.3%, demonstrating communication as a robust coordination mechanism. In contrast, we find that curriculum learning is highly sensitive to design choices: our pedagogical curriculum through progressively complex games reduced agent payoffs by 27.4% in an Iterated Public Goods Game with Punishment. Qualitative analysis reveals that curricula emphasizing defection-equilibrium games can induce "learned pessimism" in agents. These findings suggest that for coordination problems, simple communication protocols may be more reliable than experience-based training, and that curriculum design for social dilemmas requires careful attention to the strategic lessons embedded in game sequences.
- Abstract(参考訳): マルチエージェントLLMシステムにおける協調の回避は、AIアライメントに不可欠である。
直接コミュニケーションとカリキュラム学習の2つのアプローチについて検討する。
4人のプレイヤーのスタッグハントでは、1ワードの「チープトーク」チャンネルが協力関係を0%から48.3%に増加させ、堅牢な協調機構としてのコミュニケーションを示す。
対照的に、カリキュラムの学習はデザインの選択に非常に敏感である。我々の教育カリキュラムは、段階的に複雑なゲームを通して、Punishmentを伴うIterated Public Goods Gameにおいて、エージェントの支払いを27.4%減らした。
定性的分析により、欠陥均衡ゲームを強調するキュリキュラはエージェントにおいて「学習された悲観主義」を誘導できることが明らかになった。
これらの結果は,コーディネーションの問題に対して,単純なコミュニケーションプロトコルは経験に基づくトレーニングよりも信頼性が高く,ソーシャルジレンマのカリキュラム設計にはゲームシーケンスに埋め込まれた戦略的教訓に注意が必要であることを示唆している。
関連論文リスト
- Playpen: An Environment for Exploring Learning Through Conversational Interaction [84.0413820245725]
本研究は,対話ゲームが学習のフィードバック信号の源として機能するかどうかを考察する。
本稿では,対話ゲームによるオフラインおよびオンライン学習環境であるPlaypenを紹介する。
SFTによる模倣学習は、目に見えないインスタンスのパフォーマンスを向上させるが、他のスキルに悪影響を及ぼす。
論文 参考訳(メタデータ) (2025-04-11T14:49:33Z) - Learning to Coordinate without Communication under Incomplete Information [37.91176272524196]
本稿では,お互いの行動を観察することのみに頼って,言語コミュニケーションを使わずに効果的なコーディネーションを実現する方法について検討する。
本手法では, エージェントの動作シーケンスを目的信号として解釈し, 決定論的有限オートマトンから構築した有限状態トランスデューサを, エージェントが実行可能なアクション毎に構築することにより, エージェントの戦略開発を可能にする。
実験の結果,これらの戦略は非協調的手法よりも有意に優れており,直接通信による協調処理の性能と密に一致していることがわかった。
論文 参考訳(メタデータ) (2024-09-19T01:41:41Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - LLM-Coordination: Evaluating and Analyzing Multi-agent Coordination Abilities in Large Language Models [23.092480882456048]
大きな言語モデル(LLM)は、創発的な常識推論と心の理論(ToM)能力を示している。
本研究では,Pure Coordination Sets の文脈で LLM を解析するための新しいベンチマークである LLM-Coordination Benchmark を紹介する。
論文 参考訳(メタデータ) (2023-10-05T21:18:15Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Preference Communication in Multi-Objective Normal-Form Games [3.8099752264464883]
マルチオブジェクト環境において,複数のエージェントが同時に学習する問題について検討する。
協調型および自己関心型のコミュニケーションのための4つの新しい嗜好通信プロトコルを導入する。
嗜好コミュニケーションは学習過程を劇的に変化させ,循環的ナッシュ均衡の出現につながることが判明した。
論文 参考訳(メタデータ) (2021-11-17T15:30:41Z) - Curriculum-Driven Multi-Agent Learning and the Role of Implicit
Communication in Teamwork [24.92668968807012]
難解なマルチエージェントコーディネーションタスクを解決するためのカリキュラム駆動型学習戦略を提案する。
我々は、創発的な暗黙のコミュニケーションが、優れた調整レベルを実現する上で大きな役割を果たすと主張している。
論文 参考訳(メタデータ) (2021-06-21T14:54:07Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。