論文の概要: MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation
- arxiv url: http://arxiv.org/abs/2605.17292v1
- Date: Sun, 17 May 2026 07:12:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.834654
- Title: MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation
- Title(参考訳): MetaCogAgent: 自己認識型タスクデリゲーションを備えたメタ認知型マルチエージェントLLMフレームワーク
- Authors: Chenyu Wang, Yang Shu,
- Abstract要約: 本稿では,メタ認知自己評価ユニットを備えた多エージェント大規模言語モデル(LLM)フレームワークであるMetaCogAgentを提案する。
MetaCogAgentは、AutoGenよりも5%少ないAPIコールを使用し、アンサンブル投票よりも34%少ないタスク精度を82.4%達成している。
- 参考スコア(独自算出の注目度): 11.486913474115402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent large language model (LLM) systems have shown promise for solving complex tasks through agent collaboration. However, existing frameworks assign tasks based on predefined roles without considering whether an agent can accurately assess its own competence boundaries, leading to overconfident execution on tasks beyond its expertise. Inspired by metacognition theory from cognitive science, we propose MetaCogAgent, a multi-agent LLM framework where each agent is equipped with a Metacognitive Self-Assessment Unit that evaluates task-capability alignment before execution. The framework introduces three contributions: (1) a self-assessment mechanism that estimates per-task confidence by combining verbalized uncertainty with historical capability profiles; (2) an adaptive delegation protocol that routes low-confidence tasks to better-suited agents through cross-agent evaluation; and (3) a capability boundary learning module that iteratively refines each agent's competence model via cybernetic feedback. Experiments on our constructed MetaCog-Eval benchmark (700 tasks across 5 cognitive dimensions) demonstrate that MetaCogAgent achieves 82.4% task accuracy -- 8.7% above the best routing baseline -- while using 5% fewer API calls than AutoGen and 34% fewer than ensemble voting. Ablation studies confirm that each metacognitive component contributes to overall system performance.
- Abstract(参考訳): マルチエージェント大規模言語モデル (LLM) システムはエージェントの協調によって複雑なタスクを解くことを約束している。
しかし、既存のフレームワークは、エージェントが自身の能力境界を正確に評価できるかどうかを考慮せずに、事前に定義された役割に基づいてタスクを割り当てる。
認知科学からメタ認知理論に触発されたメタコグアジェント(MetaCogAgent)は,実行前にタスク能力アライメントを評価するメタ認知自己評価ユニット(Metacognitive Self-Assessment Unit)を備えた多エージェントLDMフレームワークである。
本フレームワークでは,(1)言語的不確実性と過去の能力プロファイルを組み合わせることでタスクごとの信頼度を推定する自己評価機構,(2)クロスエージェント評価による低信頼タスクを適切なエージェントにルーティングする適応デリゲートプロトコル,(3)サイバネティックフィードバックによる各エージェントの能力モデルを反復的に洗練する能力境界学習モジュール,の3つを紹介した。
構築したMetaCog-Evalベンチマーク(5つの認知次元にわたる700のタスク)の実験では、MetaCogAgentが82.4%のタスク精度 -- 最高のルーティングベースラインより8.7%高い -- を達成した一方で、AutoGenよりも5%少ないAPIコールを使用し、アンサンブル投票よりも34%少ないことが示されている。
アブレーション研究は、各メタ認知成分がシステム全体の性能に寄与することを確認する。
関連論文リスト
- Agent-First Tool API: A Semantic Interface Paradigm for Enterprise AI Agent Systems [1.3259123126940986]
本稿では,ツールインタラクションを検索,解決,プレビュー,実行,検証,フェーズ回復に分解するAgent-First Tool APIパラダイムを提案する。
このパラダイムは、6つのビジネスドメインに85の登録ツールを提供する実運用マルチテナントプラットフォームで実装され、検証されている。
論文 参考訳(メタデータ) (2026-05-11T13:30:43Z) - EvoAgent: An Evolvable Agent Framework with Skill Learning and Multi-Agent Delegation [37.26213009494508]
EvoAgentは進化可能な大規模言語モデル(LLM)のエージェントフレームワークである。
構造化されたスキル学習と階層的なサブエージェントデリゲート機構を統合する。
論文 参考訳(メタデータ) (2026-04-22T03:00:28Z) - MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation [64.2621682259008]
セルフサーチスケーリングによるマルチエージェント強化トレーニングと推論フレームワーク(MARTI-MARS2)
本稿では,MARTI-MARS2を用いたマルチエージェント強化学習・推論フレームワークを提案する。
我々は、MARTI-MARS2が77.7%を獲得し、GPT-5.1のような強力なベースラインを、挑戦的なコード生成ベンチマークで上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-08T07:28:44Z) - AgentIF-OneDay: A Task-level Instruction-Following Benchmark for General AI Agents in Daily Scenarios [49.90735676070039]
持続時間と複雑さが増大するタスクを効果的に処理するAIエージェントの能力は、成長を続けている。
エージェントタスクの多様性に十分対処することなく,タスクの難易度の向上を優先している。
本稿では,自然言語命令とAIエージェントを多種多様な日常タスクに活用できるかどうかを判定するエージェントIF-OneDayを提案する。
論文 参考訳(メタデータ) (2026-01-28T13:49:18Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。
4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。
一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文 参考訳(メタデータ) (2025-08-05T12:52:09Z) - CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs [16.234259194402163]
マルチエージェント推論を符号化し、マルチエージェントシステムにおける構造化されたトークン効率の計画を可能にするプロンプトフレームワークであるCodeAgentsを紹介する。
その結果, 計画性能は一貫した改善がみられ, 基本となる自然言語よりも3~36ポイントの絶対的な向上が見られた。
論文 参考訳(メタデータ) (2025-07-04T02:20:19Z) - MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents [59.825725526176655]
大規模言語モデル(LLM)は、自律的なエージェントとして顕著な能力を示している。
既存のベンチマークでは、単一エージェントタスクにフォーカスするか、狭いドメインに限定されており、マルチエージェントのコーディネーションと競合のダイナミクスを捉えていない。
多様な対話シナリオにまたがってLLMベースのマルチエージェントシステムを評価するためのベンチマークであるMultiAgentBenchを紹介する。
論文 参考訳(メタデータ) (2025-03-03T05:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。