論文の概要: StackPlanner: A Centralized Hierarchical Multi-Agent System with Task-Experience Memory Management
- arxiv url: http://arxiv.org/abs/2601.05890v1
- Date: Fri, 09 Jan 2026 16:09:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:50.025469
- Title: StackPlanner: A Centralized Hierarchical Multi-Agent System with Task-Experience Memory Management
- Title(参考訳): StackPlanner:タスクエクスペリエンスメモリ管理を備えた集中型階層型マルチエージェントシステム
- Authors: Ruizhe Zhang, Xinke Jiang, Zhibang Yang, Zhixin Zhang, Jiaran Gao, Yuzhen Xiao, Hongbin Lai, Xu Chu, Junfeng Zhao, Yasha Wang,
- Abstract要約: 中央のエージェントは、メモリ管理の欠如により不安定な長期のコラボレーションに悩まされることが多い。
メモリ制御を明示する階層型マルチエージェントフレームワークStackPlannerを提案する。
複数のディープサーチおよびエージェントシステムベンチマークの実験は、我々のアプローチの有効性を実証している。
- 参考スコア(独自算出の注目度): 25.50119360269554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent systems based on large language models, particularly centralized architectures, have recently shown strong potential for complex and knowledge-intensive tasks. However, central agents often suffer from unstable long-horizon collaboration due to the lack of memory management, leading to context bloat, error accumulation, and poor cross-task generalization. To address both task-level memory inefficiency and the inability to reuse coordination experience, we propose StackPlanner, a hierarchical multi-agent framework with explicit memory control. StackPlanner addresses these challenges by decoupling high-level coordination from subtask execution with active task-level memory control, and by learning to retrieve and exploit reusable coordination experience via structured experience memory and reinforcement learning. Experiments on multiple deep-search and agent system benchmarks demonstrate the effectiveness of our approach in enabling reliable long-horizon multi-agent collaboration.
- Abstract(参考訳): 大規模言語モデルに基づくマルチエージェントシステム、特に集中型アーキテクチャは、最近、複雑で知識集約的なタスクに強い可能性を示している。
しかし、中央エージェントはメモリ管理の欠如により不安定な長期的協調に悩まされ、コンテキストの肥大、エラーの蓄積、クロスタスクの一般化が不十分になる。
タスクレベルのメモリ非効率性とコーディネーションエクスペリエンスの再利用能力の両面に対処するため,明示的なメモリ制御を備えた階層型マルチエージェントフレームワークStackPlannerを提案する。
StackPlannerは、サブタスク実行からアクティブなタスクレベルのメモリコントロールにハイレベルなコーディネーションを分離し、構造化されたエクスペリエンスメモリと強化学習を通じて、再利用可能なコーディネーションエクスペリエンスの検索と活用を学習することで、これらの課題に対処する。
複数のディープ・リサーチおよびエージェント・システムベンチマークの実験は、信頼性の高い長距離マルチエージェント・コラボレーションを実現する上で、我々のアプローチの有効性を実証している。
関連論文リスト
- TALM: Dynamic Tree-Structured Multi-Agent Framework with Long-Term Memory for Scalable Code Generation [0.0]
エージェントコード生成には、複雑なコンテキスト管理と多段階推論が可能な大きな言語モデルが必要である。
本稿では,構造化タスク分解,局所化再推論,長期記憶機構を統合した動的フレームワークTALMを提案する。
HumanEval、BigCodeBench、ClassEvalベンチマークの実験結果は、TALMが一貫して強力な推論性能と高いトークン効率を提供することを示している。
論文 参考訳(メタデータ) (2025-10-27T05:07:36Z) - ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory [57.517214479414726]
ReasoningBankは、エージェントの自己判断の成功と失敗の経験から一般化可能な推論戦略を抽出するメモリフレームワークである。
テスト時には、エージェントがReasoningBankから関連する記憶を取得してそのインタラクションを知らせ、新しい学習を統合することで、時間が経つにつれてより有能になる。
本稿では,エージェントのインタラクションエクスペリエンスをスケールアップすることにより,学習プロセスの高速化と多様化を図るメモリ対応テストタイムスケーリング(MaTTS)を提案する。
論文 参考訳(メタデータ) (2025-09-29T17:51:03Z) - H$^2$R: Hierarchical Hindsight Reflection for Multi-Task LLM Agents [3.9054156855794973]
大規模言語モデル(LLM)ベースのエージェントは、マルチタスクシナリオにおいて大きな可能性を示している。
既存のアプローチでは、以前の経験や知識をモノリシックな単位として扱うことが多く、非効率で粗い知識伝達につながる。
本稿では,より微細な知識伝達が可能な新しい階層型メモリアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-09-16T08:30:08Z) - GoalfyMax: A Protocol-Driven Multi-Agent System for Intelligent Experience Entities [8.508965426627887]
私たちは、エンドツーエンドのマルチエージェントコラボレーションのためのプロトコル駆動フレームワークであるGoalfyMaxを紹介します。
GoalfyMax が Model Context Protocol (MCP) 上に構築された標準化された Agent-to-Agent (A2A) 通信層を導入
Experience Pack(XP)アーキテクチャは、タスクの合理性と実行トレースの両方を保存する階層型メモリシステムである。
論文 参考訳(メタデータ) (2025-07-13T05:13:52Z) - HiRA: A Hierarchical Reasoning Framework for Decoupled Planning and Execution in Deep Search [85.12447821237045]
HiRAは、戦略的な計画と専門的な実行を分離する階層的なフレームワークである。
提案手法では,複雑な探索タスクを集中サブタスクに分解し,各サブタスクを外部ツールと推論機能を備えたドメイン固有エージェントに割り当てる。
4つの複雑なクロスモーダルなディープ・サーチ・ベンチマークの実験により、HiRAは最先端のRAGとエージェント・ベース・システムを大きく上回っていることが示された。
論文 参考訳(メタデータ) (2025-07-03T14:18:08Z) - FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.18498389833308]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文 参考訳(メタデータ) (2025-06-18T17:06:28Z) - Variational Offline Multi-agent Skill Discovery [47.924414207796005]
本稿では,サブグループレベルの抽象化と時間レベルの抽象化を同時に取得し,マルチエージェントスキルを形成するための2つの新しい自動エンコーダ方式を提案する。
提案手法はオフラインのマルチタスクデータに適用可能であり,検出したサブグループスキルは再学習することなく,関連するタスク間で伝達可能である。
StarCraftタスクに対する実証的な評価は、既存の階層型マルチエージェント強化学習(MARL)法よりもはるかに優れていることを示している。
論文 参考訳(メタデータ) (2024-05-26T00:24:46Z) - Learning Task Decomposition with Ordered Memory Policy Network [73.3813423684999]
OMPN(Ordered Memory Policy Network)を提案し、デモから学習することでサブタスク階層を発見する。
ompnは部分的に観測可能な環境に適用でき、高いタスク分解性能を達成できる。
私たちの視覚化は、サブタスク階層がモデルに出現できることを確認します。
論文 参考訳(メタデータ) (2021-03-19T18:13:35Z) - Learning Functionally Decomposed Hierarchies for Continuous Control
Tasks with Path Planning [36.050432925402845]
我々は、長い水平方向制御タスクをうまく解決する新しい階層型強化学習アーキテクチャであるHiDeを提案する。
実験により,本手法は未知のテスト環境にまたがって一般化され,学習法および非学習法と比較して3倍の地平線長に拡張可能であることが示された。
論文 参考訳(メタデータ) (2020-02-14T10:19:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。