論文の概要: SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models
- arxiv url: http://arxiv.org/abs/2606.04202v1
- Date: Tue, 02 Jun 2026 20:40:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.376545
- Title: SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models
- Title(参考訳): SMAC-Talk: 大規模言語モデルのためのStarCraft Multi-Agent Challengeの自然言語拡張
- Authors: Joel Sol, Homayoun Najjaran,
- Abstract要約: 本稿では,協調型マルチエージェント環境におけるLLMエージェントの評価を目的とした,StarCraft Multi-Agent Challengeの自然言語拡張であるSMAC-Talkを紹介する。
SMAC-Talkは、エージェントの調整と信頼を調査するために使用される自然言語通信チャネルを含んでいる。
我々は、このコミュニケーションチャネルを使用して異なる評価シナリオを構築する。例えば、コミュニケーションだけで同盟者を混乱させ欺こうとする組込みコミュニケータの設定を含む。
- 参考スコア(独自算出の注目度): 5.960036206015683
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As LLMs become more widely deployed, they are increasingly expected to work alongside other AI agents rather than operating in isolation. Effective coordination in these settings requires agents to communicate, share information and make decisions under uncertainty. We introduce SMAC-Talk, a natural language extension of the StarCraft Multi-Agent Challenge for evaluating LLM-based agents in cooperative multi-agent environments. The environment has several key features such as decentralized control, partial observability and long-horizon decision making. SMAC-Talk includes a natural language communication channel which is used to probe agent coordination and trust. We use this communication channel to construct different evaluation scenarios, including settings with an embedded deceptive communicator that tries to disrupt and deceive allies through communication alone. We provide three agents for benchmarking using 4 models from the Qwen3.5 family and study how reasoning structure, memory and model scale affect coordination between agents. We release SMAC-Talk as an open benchmark to support the research community in developing and evaluating LLM agents in cooperative multi-agent settings.
- Abstract(参考訳): LLMがより広くデプロイされるにつれて、分離して運用するのではなく、他のAIエージェントと共に動作することがますます期待されている。
これらの設定で効果的な調整を行うには、エージェントが不確実性の下でコミュニケーションし、情報を共有し、決定を下さなければなりません。
本稿では,協調型マルチエージェント環境におけるLLMエージェントの評価を目的とした,StarCraft Multi-Agent Challengeの自然言語拡張であるSMAC-Talkを紹介する。
環境には、分散制御、部分的可観測性、長期的意思決定など、いくつかの重要な特徴がある。
SMAC-Talkは、エージェントの調整と信頼を調査するために使用される自然言語通信チャネルを含んでいる。
我々は,このコミュニケーションチャネルを用いて異なる評価シナリオを構築する。例えば,コミュニケーションだけで同盟者を混乱させ,騙そうとする,組込みの偽装通信機による設定などである。
Qwen3.5ファミリーの4つのモデルを用いてベンチマークを行うためのエージェントを3つ提供し、推論構造、メモリ、モデルスケールがエージェント間の調整に与える影響について検討する。
我々はSMAC-Talkをオープンなベンチマークとしてリリースし、LLMエージェントを協調的なマルチエージェント環境で開発・評価する研究コミュニティを支援する。
関連論文リスト
- When Numbers Start Talking: Implicit Numerical Coordination Among LLM-Based Agents [45.43445469098021]
本稿では,マルチエージェントシステムにおける隠蔽通信のゲーム理論的研究について述べる。
我々は,異なる通信体制下での4つの標準ゲーム理論設定間の相互作用を分析する。
不均一なエージェント・パーソナリティとワンショットゲームと繰り返しゲームの両方を考慮すると、隠蔽信号が出現し、協調と戦略的な結果をどう形成するかを特徴付ける。
論文 参考訳(メタデータ) (2026-01-07T12:07:48Z) - Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances [61.539442227802226]
大規模言語モデル(LLM)は、ハイレベルな意思決定をサポートするために、自律運転システム(ADS)に統合されている。
LLMは、限られた認識、不十分な協調、高い計算要求の3つの大きな課題に直面している。
マルチエージェントADSの最近の進歩は、言語によるコミュニケーションとコーディネーションを活用して、エージェント間コラボレーションを強化している。
論文 参考訳(メタデータ) (2025-02-24T03:26:13Z) - COMMA: A Communicative Multimodal Multi-Agent Benchmark [15.329501174451677]
マルチモーダルマルチエージェントシステムの協調性能を評価するための新しいパズルベンチマークであるCOMMAを紹介する。
GPT-4oのような強力なプロプライエタリモデルや、o4-miniのような推論モデルなど、最先端モデルの驚くべき弱点が明らかになった。
R1-OnevisionやLLaVA-CoTのような多くの思考推論モデルは、エージェントとエージェントのコラボレーションにおいて、ランダムなベースラインよりも優れている。
論文 参考訳(メタデータ) (2024-10-10T02:49:47Z) - SpeechAgents: Human-Communication Simulation with Multi-Modal
Multi-Agent Systems [53.94772445896213]
大規模言語モデル(LLM)に基づくマルチエージェントシステムは,人間の社会をシミュレートする上で有望な性能を示した。
本研究では,マルチモーダルLLMに基づくマルチエージェントシステムであるSpeechAgentsを提案する。
論文 参考訳(メタデータ) (2024-01-08T15:01:08Z) - Large Language Model Enhanced Multi-Agent Systems for 6G Communications [94.45712802626794]
本稿では,自然言語を用いたコミュニケーション関連タスクを解くための,カスタマイズされたコミュニケーション知識とツールを備えたマルチエージェントシステムを提案する。
セマンティック通信システムの設計により,提案方式の有効性を検証した。
論文 参考訳(メタデータ) (2023-12-13T02:35:57Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。