Fugu-MT 論文翻訳(概要): SPIKE: An Adaptive Dual Controller Framework for Cost-Efficient Long-Horizon Game Agents

論文の概要: SPIKE: An Adaptive Dual Controller Framework for Cost-Efficient Long-Horizon Game Agents

arxiv url: http://arxiv.org/abs/2605.18636v1
Date: Mon, 18 May 2026 16:43:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:50.101233
Title: SPIKE: An Adaptive Dual Controller Framework for Cost-Efficient Long-Horizon Game Agents
Title（参考訳）: SPIKE: コスト効率のよいロングホライゾンゲームエージェントのための適応型デュアルコントローラフレームワーク
Authors: Wencan Jiang, Jiangning Zhang, Jianbiao Mei, Jinzhuo Liu, Yu Yang, Xiaobin Hu, Zhucun Xue, Yong Liu, Dacheng Tao,
Abstract要約: コスト効率のよい長軸ゲーム制御のための適応型デュアルコントローラフレームワークSPIKEを提案する。 Strategic Controllerは低周波のグローバル計画、障害解析、リカバリを実行し、Reactive Controllerは厳格なトークン予算の下で高速なローカル実行を処理する。 Event Triggerは、視覚的な変化、タスクの進捗、繰り返しアクション、障害信号を監視して、制御がいつ反応性を保つか、あるいは戦略的な推論にエスカレートするかを判断する。この設計は、複数のリアクティブステップにまたがる戦略的な提案を再利用し、計画が不安定になると局所的なオーバライドをサポートし、余分な議論が役に立つ瞬間に高価な推論を予約する。
参考スコア（独自算出の注目度）: 74.84742205422825
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Long-horizon multimodal agents in open-world games must stay goal-directed across many low-level interactions under tight token and latency budgets. Existing approaches often trade off costly per-step reasoning against reactive execution that can drift, repeat failures, and recover poorly. Our key idea is to reuse strategic reasoning across locally stable segments and reinvoke it at event boundaries. We present SPIKE, an adaptive dual controller framework for cost-efficient long-horizon game control. Its Strategic Controller performs low-frequency global planning, failure analysis, and recovery, while its Reactive Controller handles fast local execution under a strict token budget. An Event Trigger monitors visual change, task progress, repeated actions, and failure signals to decide when control should stay reactive or escalate to strategic reasoning. Hierarchical Memory separates short-term experience reuse in the State-Action Memory Bank (SA-MB) from structured evidence in the State Action Knowledge Graph (SA-KG), allowing each controller to retrieve the context it needs. This design reuses strategic proposals over multiple reactive steps, supports local override when plans become stale, and reserves expensive reasoning for moments where extra deliberation is useful. On the Lite-100 split of StarDojo, SPIKE improves Lite-100 success rate (SR) by 5.0 percentage points (38.5% relative) over the strongest Lite-100 baseline and Budgeted SR by 9.3 points (75.6% relative) over the strongest budgeted baseline. It also reduces token consumption by 54.9% and latency by 40.8%. Ablations show that event triggering, reactive override, and heterogeneous memory each contribute to success and recovery, supporting selective reasoning rather than reasoning at every step.
Abstract（参考訳）: オープンワールドゲームにおけるロングホライゾンマルチモーダルエージェントは、厳密なトークンと遅延予算の下で多くの低レベルインタラクションを目標に守らなければならない。既存のアプローチでは、フロートし、失敗を繰り返し、回復が不十分なリアクティブ実行に対して、ステップ毎にコストのかかる推論をトレードオフすることが多い。私たちのキーとなる考え方は、ローカルの安定したセグメントをまたいだ戦略的推論を再利用し、イベント境界で再起動することです。コスト効率のよい長軸ゲーム制御のための適応型デュアルコントローラフレームワークSPIKEを提案する。 Strategic Controllerは低周波のグローバル計画、障害解析、リカバリを実行し、Reactive Controllerは厳格なトークン予算の下で高速なローカル実行を処理する。 Event Triggerは、視覚的な変化、タスクの進捗、繰り返しアクション、障害信号を監視して、制御がいつ反応性を保つか、あるいは戦略的な推論にエスカレートするかを判断する。階層記憶(Hierarchical Memory)は、SA-MB(State-Action Memory Bank)における短期的な体験再利用と、SA-KG(State Action Knowledge Graph)における構造化された証拠を分離し、各コントローラが必要なコンテキストを検索できるようにする。この設計は、複数のリアクティブステップにまたがる戦略的な提案を再利用し、計画が不安定になると局所的なオーバライドをサポートし、余分な議論が役に立つ瞬間に高価な推論を予約する。 StarDojoのLite-100分割でSPIKEはLite-100成功率(SR)を5.0ポイント(38.5%)、Budgeted SRを9.3ポイント(75.6%)改善した。またトークン消費を54.9%削減し、レイテンシを40.8%削減する。アブレーションは、イベントトリガ、リアクティブオーバーライド、ヘテロジニアスメモリが成功と回復に寄与し、すべてのステップで推論するのではなく、選択的な推論をサポートすることを示している。

論文の概要: SPIKE: An Adaptive Dual Controller Framework for Cost-Efficient Long-Horizon Game Agents

関連論文リスト