論文の概要: Byzantine Cheap Talk: Adversarial Resilience and Topology Effects in LLM Coordination Games
- arxiv url: http://arxiv.org/abs/2606.07790v1
- Date: Fri, 05 Jun 2026 19:06:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.392877
- Title: Byzantine Cheap Talk: Adversarial Resilience and Topology Effects in LLM Coordination Games
- Title(参考訳): ビザンチン・チープトーク : LLMコーディネーションゲームにおける逆レジリエンスとトポロジー効果
- Authors: Aya El Mir, Martin Takáč, Salem Lahlou,
- Abstract要約: 本研究は,マルチエージェントコーディネーションゲームにおいて,安価なチャネルが協調作業を可能にすることを示す。
6つのモデルファミリーと720のトライアルにまたがる4人プレイヤのStag Huntにおける2つの脆弱性クラスを調査した。
全てのモデルコホートをまたいで複製する2つの安定な行動アーチタイプを同定する。
- 参考スコア(独自算出の注目度): 4.3857499122259815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent LLM systems increasingly rely on communication protocols for coordination, yet their robustness under adversarial and structural constraints remains poorly understood. Building on prior work showing that cheap-talk channels enable cooperation in LLM coordination games, we investigate two vulnerability classes in a 4-player Stag Hunt across six model families and 720 trials. First, when Byzantine agents signal cooperation but defect, non-Byzantine agents detect the betrayal within one round yet fail to adapt collectively: a substantial fraction continue cooperating despite repeated exploitation, unable to recover coordination due to the game's unanimity payoff structure. Second, explicitly restricting communication topology collapses cooperation, while applying identical restrictions silently preserves near-perfect cooperation. This establishes that coordination failure stems from agents' meta-reasoning about hidden information, not information loss itself. We identify two stable behavioral archetypes that replicate across all model cohorts: Defection-Prone models that switch permanently after betrayal, and Cooperation-Persistent models that continue cooperating at significant individual cost. These findings reveal concrete security vulnerabilities: communication channels can be exploited as adversarial injection vectors, and disclosing network topology to agents can degrade coordination even without any adversary present.
- Abstract(参考訳): マルチエージェントLLMシステムは、協調のための通信プロトコルをますます頼りにしているが、敵対的制約や構造的制約の下での堅牢性はよく分かっていない。
LLMコーディネートゲームにおいて、安価なトークチャンネルが協調できることを示す先行研究に基づいて、6つのモデルファミリーと720のトライアルにわたる4人プレイのStag Huntにおける2つの脆弱性クラスを調査した。
まず、ビザンツのエージェントが協力を合図するが欠陥を通知すると、非ビザンツのエージェントは1ラウンド以内の裏切りを検知するが、一括して適応することができない。
第二に、コミュニケーショントポロジを明示的に制限することは協力を崩壊させ、同一の制約を適用することは、ほぼ完璧な協力を静かに維持する。
このことは、調整失敗は情報損失そのものではなく、隠された情報に関するエージェントのメタ推論に由来することを証明している。
全てのモデルコホートをまたいで複製する2つの安定な行動アーチタイプを同定する。
通信チャネルを敵のインジェクションベクターとして利用でき、ネットワークトポロジをエージェントに開示することで、敵がいない場合でも協調性を低下させることができる。
関連論文リスト
- The Cost of Consensus: Malignant Epistemic Herding and Adaptive Gating in Distributed Multi-Agent Search [2.435326482104274]
コーディネーションはタスク完了を支援するための信念を共有するために必要だが、通信は帯域幅を犠牲にし、遅延を導入し、もしうまく行わなければ、集合的推論を劣化させる可能性がある。
この緊張は、分散センシングネットワーク、自律偵察、協調サイバー防御など、帯域幅に制約のあるデプロイメントにおいて特に深刻である。
我々は、この区別を形式化し、Jensen-Shannon Divergence や、コンセンサスに対するレートのような調整指標だけでは検出できないことを示す。
論文 参考訳(メタデータ) (2026-05-07T22:07:25Z) - Improving the Efficiency of Language Agent Teams with Adaptive Task Graphs [52.26652574704317]
大規模言語モデル(LLM)はますますチームにデプロイされているが、既存のコーディネーションアプローチは2つの極端な部分を占めることが多い。
本稿では,Language Agent Teams for Task Evolution (LATTE)を紹介した。
論文 参考訳(メタデータ) (2026-05-07T14:19:17Z) - Talk is Cheap, Communication is Hard: Dynamic Grounding Failures and Repair in Multi-Agent Negotiation [2.5089149965583086]
接地とは、現在のコミュニケーション目的に十分な相互信条を確立するための協調的なプロセスである。
現在のマルチエージェント大規模言語モデル(LLM)ベンチマークは、静的なワンショットタスクに焦点を当てている。
2人のエージェントが共同で最適な結果が検証可能なプライベートプロジェクトに向けて共有リソースを割り当てる、反復多ターン交渉ゲームを導入する。
論文 参考訳(メタデータ) (2026-05-03T07:12:14Z) - More Capable, Less Cooperative? When LLMs Fail At Zero-Cost Collaboration [1.4254497466846006]
我々は、摩擦のない環境下での協調行動について研究し、協力から全ての戦略的複雑さを取り除く。
私たちは、協力の失敗と能力の失敗を分離し、エージェント推論分析を通じてその起源を追跡します。
この結果から,マルチエージェントシステムにおける協調問題の解決は,インテリジェンスのスケーリングだけでは不可能であることが示唆された。
論文 参考訳(メタデータ) (2026-04-09T05:24:27Z) - Colosseum: Auditing Collusion in Cooperative Multi-Agent Systems [55.51100373104311]
マルチエージェント設定におけるLLMエージェントの協調動作を監査するためのフレームワークであるColosseumを提案する。
コロッセウムは、異なる目的、説得戦術、ネットワークトポロジの下で、それぞれのLSMを照合するためにテストする。
我々は、エージェントがテキストでコラージュするが、しばしば非コラージュ的な行動を選ぶときに、論文上での「共謀」を発見する。
論文 参考訳(メタデータ) (2026-02-16T21:27:38Z) - Learning to Interact in World Latent for Team Coordination [53.51290193631586]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文 参考訳(メタデータ) (2025-09-29T22:13:39Z) - The Sum Leaks More Than Its Parts: Compositional Privacy Risks and Mitigations in Multi-Agent Collaboration [72.33801123508145]
大規模言語モデル(LLM)はマルチエージェントシステムに不可欠なものである。
プライバシーリスクは、暗記、直接推論、シングルターン評価を超えて現れる。
特に、相互作用によって構成される一見無害な反応は、敵が機密情報の回復を累積的に行うことができる。
論文 参考訳(メタデータ) (2025-09-16T16:57:25Z) - Learning to Coordinate without Communication under Incomplete Information [37.91176272524196]
本稿では,お互いの行動を観察することのみに頼って,言語コミュニケーションを使わずに効果的なコーディネーションを実現する方法について検討する。
本手法では, エージェントの動作シーケンスを目的信号として解釈し, 決定論的有限オートマトンから構築した有限状態トランスデューサを, エージェントが実行可能なアクション毎に構築することにより, エージェントの戦略開発を可能にする。
実験の結果,これらの戦略は非協調的手法よりも有意に優れており,直接通信による協調処理の性能と密に一致していることがわかった。
論文 参考訳(メタデータ) (2024-09-19T01:41:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。