Fugu-MT 論文翻訳(概要): Society of Mind Meets Real-Time Strategy: A Hierarchical Multi-Agent Framework for Strategic Reasoning

論文の概要: Society of Mind Meets Real-Time Strategy: A Hierarchical Multi-Agent Framework for Strategic Reasoning

arxiv url: http://arxiv.org/abs/2508.06042v1
Date: Fri, 08 Aug 2025 05:57:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-11 20:39:06.096812
Title: Society of Mind Meets Real-Time Strategy: A Hierarchical Multi-Agent Framework for Strategic Reasoning
Title（参考訳）: ソーシャル・オブ・マインドとリアルタイム戦略:戦略推論のための階層的マルチエージェント・フレームワーク
Authors: Daechul Ahn, San Kim, Jonghyun Choi,
Abstract要約: 我々は,Strategic Planner (SP) と呼ばれるメタコントローラの下で,特殊模倣学習エージェントを利用する階層型マルチエージェントフレームワークを提案する。専門家によるデモンストレーションによって、各特殊エージェントは、航空支援や防御演習のような独特の戦略を学び、一貫性のある、構造化された多段階のアクションシーケンスを生成する。 SPはこれらの提案を1つの環境適応プランに編成し、局所的な決定が長期的な戦略と整合することを保証する。
参考スコア（独自算出の注目度）: 16.35236123729838
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) have recently demonstrated impressive action sequence prediction capabilities but often struggle with dynamic, long-horizon tasks such as real-time strategic games. In a game such as StarCraftII (SC2), agents need to manage resource constraints and adapt to evolving battlefield situations in a partially observable environment. This often overwhelms exisiting LLM-based approaches. To address these challenges, we propose a hierarchical multi-agent framework that employs specialized imitation learning agents under a meta-controller called Strategic Planner (SP). By expert demonstrations, each specialized agent learns a distinctive strategy, such as aerial support or defensive maneuvers, and produces coherent, structured multistep action sequences. The SP then orchestrates these proposals into a single, environmentally adaptive plan that ensures local decisions aligning with long-term strategies. We call this HIMA (Hierarchical Imitation Multi-Agent). We also present TEXTSCII-ALL, a comprehensive SC2 testbed that encompasses all race match combinations in SC2. Our empirical results show that HIMA outperforms state of the arts in strategic clarity, adaptability, and computational efficiency, underscoring the potential of combining specialized imitation modules with meta-level orchestration to develop more robust, general-purpose AI agents.
Abstract（参考訳）: 大規模言語モデル(LLM)は、最近、印象的なアクションシーケンス予測機能を示したが、リアルタイム戦略ゲームのような動的で長期のタスクにしばしば苦労している。 StarCraftII (SC2)のようなゲームでは、エージェントはリソースの制約を管理し、部分的に観察可能な環境下での戦場の状況に適応する必要がある。これは LLM ベースのアプローチを強要することが多い。これらの課題に対処するために,Strategic Planner (SP) と呼ばれるメタコントローラの下で,特殊模倣学習エージェントを利用する階層型マルチエージェントフレームワークを提案する。専門家によるデモンストレーションによって、各特殊エージェントは、航空支援や防御演習のような独特の戦略を学び、一貫性のある、構造化された多段階のアクションシーケンスを生成する。 SPはこれらの提案を1つの環境適応プランに編成し、長期戦略に沿った局所的な決定を確実にする。これをヒマと呼ぶ。また、SC2における全てのレースマッチの組み合わせを包含する総合的なSC2テストベッドであるTEXTSCII-ALLを提示する。実験の結果、HIMAは戦略的明確性、適応性、計算効率において最先端の能力を発揮しており、より堅牢で汎用的なAIエージェントを開発するために、特殊模倣モジュールとメタレベルのオーケストレーションを組み合わせる可能性を示している。

論文の概要: Society of Mind Meets Real-Time Strategy: A Hierarchical Multi-Agent Framework for Strategic Reasoning

関連論文リスト