FuguReport

OrgAgent: Organize Your Multi-Agent System like a Company

著者 Yiru Wang, Xinyue Shen, Yaohui Han, Michael Backes, Pin-Yu Chen, Tsung-Yi Ho
所属 CISPA Helmholtz Center for Information Security / IBM / The Chinese University of Hong Kong
カテゴリ Method / Multi-Agent Organization / Hierarchical corporate-style system design, Application / Multi-Agent Systems / Organizing agents like a company, Theory / Organizational Models / Comparative organizational structure analysis
ライセンス CC BY 4.0

Abstractの概要

本論文は、企業型の階層的マルチエージェントシステムであるOrgAgentを提案しており、協調プロセスをガバナンス層、実行層、コンプライアンス層に分離する。このフレームワークでは、企業に着想を得た役割(CEO、CTO、COO、Drafter、Reviewer、Specialist、CSO、CCO)を定義し、複数の実行モード(DIRECT、LIGHT MAS、FULL MAS)およびポリシー(STRICT、BALANCE、NOCAP、AUTO)をサポートする。著者らは、GPT-5 mini、GPT-OSS-120B、Llama 3.1 8Bを用いて、MuSiQue、MuSR、SQuAD 2.0における階層型組織とフラット型組織を評価している。結果として、階層型組織はMuSiQueおよびSQuAD 2.0においてフラット型および単一エージェントのベースラインに対して概ね性能が向上し、全報告設定においてフラット型協調と比較してトークン消費量も削減されたが、MuSRにおける結果はまちまちであった。

新規性

本論文は、局所的なインタラクションメカニズムのみに焦点を当てるのではなく、組織構造そのものをマルチエージェントシステムの設計・評価における中心的な変数として扱っている。明示的なガバナンス層、実行層、コンプライアンス層を備えた企業型階層構造と、設定可能な実行モードおよびポリシーを組み合わせて提案し、汎用的な推論タスクにおけるフラット型と階層型MASの初の体系的な実証比較を提供している。

成果

階層型OrgAgentは、テストされた3つのモデル全てにおいてMuSiQueおよびSQuAD 2.0で最も優れた結果を達成し、フラット型MASに対する性能向上はMuSiQueで+18.97%~+123.99%、SQuAD 2.0で+58.96%~+120.47%と報告されている。全ベンチマークおよびモデルにおいてフラット型MASよりも一貫してトークン使用量が少なく、削減率は46.38%~79.31%であった。ただし、MuSRではGPT-OSS-120BおよびLLaMA-3.1-8Bにおいてフラット型組織が階層型協調を上回った。

論文の注目点

  1. OrgAgentは、マルチエージェント推論をガバナンス層、実行層、コンプライアンス層に構造化し、企業型の役割分担、スキルベースのワーカープール、設定可能な実行モードおよびポリシーを備えている。
  2. 階層型協調は、3つのモデル全てにおいてMuSiQueおよびSQuAD 2.0でフラット型協調を上回り、トークン使用量を46~79%一貫して削減したが、MuSRではGPT-OSS-120BおよびLLaMA-3.1-8Bにおいてフラット型組織の方が優れていた。
  3. 協調行動の分析により、モデル依存のスキル特化パターンが明らかになり、階層型ポリシー下では回答不能なSQuAD 2.0の質問に対する棄権率が最大39.78%と大幅に高くなったのに対し、フラット型およびベースライン設定ではほぼゼロであった。

参考リンク

このページはGPT-5、Claude Opus 4、Gemini 3、Gemini 3.1 Flash Image 及びその上位バージョンなどの生成AIを用いて作成されています。内容の保証は一切できません。