論文の概要: Queen-Bee Agents: A BeeSpec-Centered Architecture for Governed Enterprise MCP Orchestration
- arxiv url: http://arxiv.org/abs/2606.06545v1
- Date: Thu, 04 Jun 2026 07:12:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.361393
- Title: Queen-Bee Agents: A BeeSpec-Centered Architecture for Governed Enterprise MCP Orchestration
- Title(参考訳): Queen-Bee Agents: Governed Enterprise MCP OrchestrationのためのBeeSpec中心アーキテクチャ
- Authors: Dutao Zhang, Liaotian,
- Abstract要約: 管理されたマルチエージェントアーキテクチャであるQueen-Beeを紹介し、Queenコントロールプレーンが機能を取得し、タスクスコープ実行を計画し、構造化されたBeeSpecをコンパイルする。
ガバナンスに敏感な要求、検索駆動のプロビジョニング、スコープ化されたローカル実行、化学ワークフローの統合にまたがる59のエンタープライズスタイルのタスクに対して、システムを評価した。
検索駆動のQueen-Beeは、タスク成功率0.964、ガバナンスの失敗ゼロ、そして静的なQueen-Beeベースラインとパーミッシブな単一エージェントベースラインよりもはるかに優れたスコープ実行品質を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enterprise agent systems increasingly need to connect large language models to private tools, internal knowledge, and Model Context Protocol (MCP) interfaces. In this setting, raw task capability is insufficient: organizations also require policy enforcement, tenant-scoped isolation, and execution that remains within explicit operational boundaries. We present Queen-Bee, a governed multi-agent architecture in which a Queen control plane retrieves capabilities, plans task-scoped execution, and compiles a structured BeeSpec that is executed by specialized Bee agents under constrained tool access. We implement a working prototype with tenant-scoped MCP connectors, audit-backed execution-time governance, retrieval-driven weak incubation, and multiple provisioning backends. We evaluate the system on 59 enterprise-style tasks spanning governance-sensitive requests, retrieval-driven provisioning, scoped local execution, and chemistry workflow integration. The retrieval-driven Queen-Bee variant achieves a task success rate of 0.964, zero governance failures, and substantially better scoped execution quality than both a static Queen-Bee baseline and a permissive single-agent baseline. We further show a multi-Bee chemistry workflow with explicit approval gating and a concrete top-3 shortlist grounded in real upstream evidence and screening artifacts. Additional comparisons with hybrid retrieval and LLM-guided provisioning show that richer provisioning backends are viable but do not outperform the lightweight structured retriever on the current small, highly structured capability registry. The results provide prototype-level systems evidence rather than a production deployment study, and suggest that enterprise agent platforms should be evaluated not only by capability, but also by governed provisioning, isolation behavior, scoped execution quality, and artifact-aware workflow coordination.
- Abstract(参考訳): エンタープライズエージェントシステムは、大きな言語モデルをプライベートツール、内部知識、モデルコンテキストプロトコル(MCP)インターフェースに接続する必要がある。
この設定では、生のタスク能力は不十分である。組織は、明確な運用境界内に留まるポリシー執行、テナントスコープの分離、実行も必要である。
管理されたマルチエージェントアーキテクチャであるQueen-Beeは、Queenコントロールプレーンが機能を取得し、タスクスコープ実行を計画し、制約されたツールアクセス下で特殊なBeeエージェントによって実行される構造化BeeSpecをコンパイルする。
我々は,テナントスコープ型MPPコネクタ,監査支援型実行時間ガバナンス,検索駆動型弱いインキュベーション,複数プロビジョニングバックエンドを備えた動作プロトタイプを実装した。
ガバナンスに敏感な要求、検索駆動のプロビジョニング、スコープ化されたローカル実行、化学ワークフローの統合にまたがる59のエンタープライズスタイルのタスクに対して、システムを評価した。
検索駆動のQueen-Beeは、タスク成功率0.964、ガバナンスの失敗ゼロ、そして静的なQueen-Beeベースラインとパーミッシブな単一エージェントベースラインよりもはるかに優れたスコープ実行品質を実現している。
さらに、明示的な承認ゲーティングを備えたマルチビー化学ワークフローと、実際の上流のエビデンスとスクリーニングアーティファクトを基盤とした具体的なトップ3ショートリストを示す。
ハイブリッド検索とLCM誘導プロビジョニングと比較すると、よりリッチなプロビジョニングバックエンドは実現可能であるが、現在の小規模で高度に構造化された機能レジストリでは、軽量な構造化されたレトリバーよりも優れていない。
この結果は,製品展開研究よりもプロトタイプレベルのシステムエビデンスを提供し,企業エージェントプラットフォームを機能だけでなく,管理されたプロビジョニング,分離動作,スコープ化された実行品質,アーティファクト対応のワークフロー調整によって評価すべきであることを示唆している。
関連論文リスト
- AgensFlow: A Coordination-Policy Substrate for Multi-Agent Systems [0.0]
AgensFlowは、部分的な可観測性の下でのオンラインポリシー学習問題としてマルチエージェントコーディネーションを扱う。
AgensFlowは、分散システムインシデントタスクとセキュリティ管理者タスクの2つのコーパスで評価されている。
論文 参考訳(メタデータ) (2026-05-26T08:10:52Z) - Testing Agentic Workflows with Structural Coverage Criteria [0.21485350418225244]
マルチエージェントワークフロー仕様に対する構造的テスト手法を提案する。
このアプローチは、それぞれのワークフローを型付きコーディネーショングラフとして表現する。
到達可能なエージェント、ツールエッジ、制限されたツールエッジ、デリゲートエッジに対するカバレッジ義務を導出する。
論文 参考訳(メタデータ) (2026-05-26T04:07:55Z) - Towards Security-Auditable LLM Agents: A Unified Graph Representation [22.355591892994642]
本稿ではエージェントセキュリティ監査のための統合構造表現であるエージェントBOMを提案する。
エージェントBOMは、クロスセッションメモリ中毒やツール誤用など、ステルス攻撃チェーンを再構築できることを示す。
Agent-BOMは複雑なエージェントエコシステムにおける根本原因分析とセキュリティ適応のための統一的で監査可能な基盤を提供する。
論文 参考訳(メタデータ) (2026-05-07T18:14:29Z) - Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows [67.92316850084575]
ワークフローエージェントのライブベンチマークであるClaw-Eval-Liveを紹介する。
各リリースは、公開ワークフロー要求信号から構築される。
Claw-Eval-Liveは実行トレース、監査ログ、サービス状態、実行後のワークスペースアーティファクトを記録する。
論文 参考訳(メタデータ) (2026-04-30T17:23:19Z) - Small Model as Master Orchestrator: Learning Unified Agent-Tool Orchestration with Parallel Subtask Decomposition [61.291733522717415]
Agent-as-Toolは並列オーケストレーションのパラダイムであり、エージェントとツールの両方を標準化された学習可能なアクション空間に緩和する。
ParaManagerは、サブタスク解決から計画決定を分離し、ステート対応の並列サブタスク分解、デリゲート、非同期実行を可能にする。
実験により、ParaManagerは複数のベンチマークで高い性能を示し、目に見えないモデルプールの下で堅牢な一般化を示す。
論文 参考訳(メタデータ) (2026-04-18T14:41:27Z) - OrgAgent: Organize Your Multi-Agent System like a Company [75.47076168155817]
企業スタイルの階層型マルチエージェントフレームワークであるOrgAgentを紹介します。
企業スタイルの階層で組織されたマルチエージェントシステムは、一般的に他の組織構造よりも優れています。
論文 参考訳(メタデータ) (2026-04-01T15:21:14Z) - From Tool Orchestration to Code Execution: A Study of MCP Design Choices [20.817336331051752]
Model Context Protocols(MCP)は、エージェントシステムが異種実行環境を横断してツールを発見し、選択し、オーケストレーションするための統一されたプラットフォームを提供する。
最近のMPP設計では、コード実行を第一級の機能として組み込んでおり、これはCode Execution MCP(CEMCP)と呼ばれるアプローチである。
この研究は、コンテキスト結合(伝統的)とコンテキスト分離(CEMCP)のアーキテクチャ的区別を形式化し、それらの基本的なスケーラビリティのトレードオフを分析する。
論文 参考訳(メタデータ) (2026-02-17T19:03:08Z) - Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。
このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。
計算コストを削減しながら、大きな利益を得ることができます。
論文 参考訳(メタデータ) (2025-10-27T17:59:14Z) - AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.406849007798858]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。