論文の概要: You Only Align Once: Propagating Cooperative Behaviors in Multi-Agent Systems through Seed Agents
- arxiv url: http://arxiv.org/abs/2605.27586v1
- Date: Tue, 26 May 2026 18:56:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.469242
- Title: You Only Align Once: Propagating Cooperative Behaviors in Multi-Agent Systems through Seed Agents
- Title(参考訳): 一度だけアライメントする:種子エージェントによる多エージェントシステムにおける協調行動の促進
- Authors: Nicole Hsing, Asuka Yuxi Zheng, Yi Zhao, Haoqin Tu, Jen-Tse Huang,
- Abstract要約: 一つのエージェントが、自然言語の相互作用を通じて、訓練されていないエージェントに協調的な振る舞いを伝達できることが示される。
我々は、チームベースの反復刑務所ジレンマであるレッドブラックゲーム(Red-Black Game)でこれを研究し、チームメイトが故意に投票してチームの集団行動を決定する。
- 参考スコア(独自算出の注目度): 16.2791635094953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ensuring agent behaviors in distributed open multi-agent systems remains challenging, especially as populations grow and unaligned agents may exist. We show that a single aligned agent can propagate cooperative behaviors to untrained agents purely through natural language interaction, a phenomenon we term Alignment Propagation. We study this in the Red-Black Game, a team-based iterated Prisoner's Dilemma in which teammates deliberate and vote to determine their team's collective action. By distilling the cooperative reasoning and persuasive dialogues of a teacher model into a Qwen-3-14B, we obtain a seed agent that, when placed among four untrained teammates, doubles the cooperation rate from 24.8% to 62.2%, outperforming the teacher model and a vanilla Gemini-3.1-Pro. Remarkably, a seed trained exclusively on the RedBlack Game transfers zero-shot to Sugarscape, a spatially grounded survival simulation with pairwise trading, achieving a 91.5% trade success rate versus a 21.6% baseline. Our results reframe multi-agent alignment from an exhaustive per-agent training problem to a scalable social capability that can be engineered through strategic seed placement.
- Abstract(参考訳): 分散オープンマルチエージェントシステムにおけるエージェントの挙動の確保は、特に人口増加と不整合エージェントが存在する可能性があるため、依然として困難である。
一つのエージェントが、自然言語の相互作用を通じて純粋に訓練されていないエージェントに協調行動を伝達できることを示し、この現象をアライメント・プロパゲーションと呼ぶ。
我々は、チームベースの反復刑務所ジレンマであるレッドブラックゲーム(Red-Black Game)でこれを研究し、チームメイトが故意に投票してチームの集団行動を決定する。
教師モデルの協調的推論と説得的対話をQwen-3-14Bに蒸留することにより、訓練されていない4人のチームメイトに配置すると、協力率が24.8%から62.2%に倍増し、教師モデルとバニラGemini-3.1-Proを上回ったシードエージェントを得る。
特筆すべきは、レッドブラックゲームに特化して訓練された種子は、ゼロショットをスガースケープに転送し、空間的に座屈した生存シミュレーションをペア取引で行い、91.5%の貿易成功率と21.6%のベースラインを達成したことである。
その結果, マルチエージェントアライメントを, 徹底的なエージェントごとのトレーニング問題から, 戦略的なシード配置によって構築可能なスケーラブルなソーシャル機能に再構成した。
関連論文リスト
- Multi-Agent Training for Pommerman: Curriculum Learning and Population-based Self-Play Approach [11.740631954398292]
Pommermanはマルチエージェントトレーニングのための理想的なベンチマークであり、同盟エージェント間のコミュニケーション能力を持つ2つのチームのための戦場を提供する。
本研究は,カリキュラム学習と人口ベースセルフプレイを組み合わせることで,Pommermanをプレイするマルチエージェントシステムを学習するためのシステムを提案する。
論文 参考訳(メタデータ) (2024-06-30T11:14:29Z) - On the Complexity of Learning to Cooperate with Populations of Socially Rational Agents [17.015143707851358]
有限繰り返しの2つのプレイヤー汎用行列ゲームにおいて,エージェントのテキストポピュレーションと協調する問題を考える。
以上の結果から,これらの仮定だけでは,標的個体群とテミセロショットの連携を確保するには不十分であることが示唆された。
効果的な協調戦略を学習するために必要なサンプル数について,上層および下層境界を提供する。
論文 参考訳(メタデータ) (2024-06-29T11:59:52Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - BACKDOORL: Backdoor Attack against Competitive Reinforcement Learning [80.99426477001619]
バックドア攻撃を複数のエージェントを含むより複雑なRLシステムに移行する。
概念実証として、敵のエージェントが被害者エージェントのバックドアを独自のアクションでトリガーできることを実証します。
その結果, バックドアが作動すると, 有効でない場合と比較して, 被害者の勝利率は17%から37%に低下することがわかった。
論文 参考訳(メタデータ) (2021-05-02T23:47:55Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - Natural Emergence of Heterogeneous Strategies in Artificially
Intelligent Competitive Teams [0.0]
我々はFortAttackと呼ばれる競合するマルチエージェント環境を開発し、2つのチームが互いに競合する。
このような振る舞いがチームの成功に繋がる場合、同種エージェント間の異種行動の自然発生を観察する。
我々は、進化した反対戦略を利用して、友好的なエージェントのための単一のポリシーを訓練するアンサンブルトレーニングを提案する。
論文 参考訳(メタデータ) (2020-07-06T22:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。