Fugu-MT 論文翻訳(概要): Verification-Aware Planning for Multi-Agent Systems

論文の概要: Verification-Aware Planning for Multi-Agent Systems

arxiv url: http://arxiv.org/abs/2510.17109v1
Date: Mon, 20 Oct 2025 02:54:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-25 00:56:39.288862
Title: Verification-Aware Planning for Multi-Agent Systems
Title（参考訳）: マルチエージェントシステムの検証・評価計画
Authors: Tianyang Xu, Dan Zhang, Kushan Mitra, Estevam Hruschka,
Abstract要約: We present VeriMAP, a framework for multi-agent collaboration with verification-aware planning。プランナーはタスクを分解し、サブタスクの依存関係をモデル化し、プランナー定義のパス基準をエンコードする。検証対応計画がマルチエージェントシステムにおける信頼性の高い協調と反復的改善を実現する方法を示す。
参考スコア（独自算出の注目度）: 35.82875628010279
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language model (LLM) agents are increasingly deployed to tackle complex tasks, often necessitating collaboration among multiple specialized agents. However, multi-agent collaboration introduces new challenges in planning, coordination, and verification. Execution failures frequently arise not from flawed reasoning alone, but from subtle misalignments in task interpretation, output format, or inter-agent handoffs. To address these challenges, we present VeriMAP, a framework for multi-agent collaboration with verification-aware planning. The VeriMAP planner decomposes tasks, models subtask dependencies, and encodes planner-defined passing criteria as subtask verification functions (VFs) in Python and natural language. We evaluate VeriMAP on diverse datasets, demonstrating that it outperforms both single- and multi-agent baselines while enhancing system robustness and interpretability. Our analysis highlights how verification-aware planning enables reliable coordination and iterative refinement in multi-agent systems, without relying on external labels or annotations.
Abstract（参考訳）: 大規模言語モデル(LLM)エージェントは複雑なタスクに対処するためにますますデプロイされ、しばしば複数の特殊エージェント間の協調を必要とする。しかし、マルチエージェントのコラボレーションは、計画、調整、検証における新しい課題をもたらす。実行失敗はしばしば、欠陥のある推論だけで起こるのではなく、タスクの解釈や出力形式、エージェント間のハンドオフにおける微妙なミスアライメントから生じる。これらの課題に対処するため,検証対応計画とマルチエージェント協調のためのフレームワークであるVeriMAPを提案する。 VeriMAPプランナーは、タスク、サブタスク依存のモデルを分解し、Pythonと自然言語のサブタスク検証関数(VF)としてプランナー定義のパス基準をエンコードする。多様なデータセット上でVeriMAPを評価し、システムの堅牢性と解釈可能性を高めながら、単エージェントベースラインとマルチエージェントベースラインの両方より優れていることを示す。本分析では,検証対応計画が外部ラベルやアノテーションに頼ることなく,マルチエージェントシステムにおける信頼性の高い調整と反復的改善を実現する方法を強調した。

関連論文リスト

SYMPHONY: Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly [6.444704310331922]
本稿では,新しいマルチエージェント・プランニング・フレームワークであるSYMPHONY(Synergistic Multi-Adnt Planning with Heterogeneous langauge model assembly)を提案する。エージェント間の多様な推論パターンを活用することで、SYMPHONYはロールアウトの多様性を高め、より効果的な探索を促進する。実験結果から,SYMPHONYはコンシューマグレードのハードウェア上にデプロイ可能なオープンソースLLMをインスタンス化した場合でも,高い性能を発揮することが示された。
論文参考訳（メタデータ） (2026-01-30T06:26:34Z)
ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文参考訳（メタデータ） (2026-01-27T13:43:59Z)
BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization [41.08366028094234]
大規模言語モデル(LLM)は、現実世界のソフトウェア工学の問題を一般化するのに苦労する。既存のシステムはワークフロー全体の問題を処理するために、単一のエージェントに依存することが多い。人間の技術者が複雑な問題を分解する方法に触発され、我々はSWEエージェントをオーケストラとして構成し、特殊なサブエージェントをコーディネートすることを提案する。
論文参考訳（メタデータ） (2025-12-29T17:41:11Z)
Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文参考訳（メタデータ） (2025-11-21T12:25:47Z)
AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文参考訳（メタデータ） (2025-10-06T23:20:49Z)
XAgents: A Unified Framework for Multi-Agent Cooperation via IF-THEN Rules and Multipolar Task Processing Graph [14.273739638741139]
XAgentsはマルチポーラタスク処理グラフとIF-THENルールに基づいて構築された統合マルチエージェント協調フレームワークである。 XAgentsは、知識型および論理型問合せタスクの両方において、最先端のシングルエージェントおよびマルチエージェントアプローチを一貫して超越している。
論文参考訳（メタデータ） (2025-09-12T08:40:58Z)
Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。 4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文参考訳（メタデータ） (2025-08-05T12:52:09Z)
Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration [63.90193684394165]
マルチエージェント・クロスタスク体験学習(MAEL)は,LSM駆動型エージェントに明示的なクロスタスク学習と経験蓄積を付与する新しいフレームワークである。経験的学習フェーズでは、タスク解決ワークフローの各ステップの品質を定量化し、その結果の報酬を記憶する。推論中、エージェントは、各推論ステップの有効性を高めるために、いくつかの例として、高頻度のタスク関連体験を検索する。
論文参考訳（メタデータ） (2025-05-29T07:24:37Z)
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration [63.31211701741323]
我々はマルチエージェント・マルチモデル推論を生成にまで拡張し、特に改良による忠実度の向上を図っている。我々は,各サブタスクに対して固有の評価を設計し,マルチエージェント(複数インスタンス)とマルチモデル(多変数LPMタイプ)の両方がエラー検出やクオリティクスに有効であることを示す。我々はこれらの知見を、マルチエージェント・マルチモデル・リファインメント(MAMM-Refinement)と呼ばれる最終的な"レシピ"に統合し、マルチエージェント・マルチモデルコラボレーションがパフォーマンスを大幅に向上させる。
論文参考訳（メタデータ） (2025-03-19T14:46:53Z)
Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文参考訳（メタデータ） (2024-10-03T04:07:51Z)
TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation [41.21899915378596]
動的タスク分解・エージェント生成(TDAG)に基づくマルチエージェントフレームワークを提案する。このフレームワークは複雑なタスクを小さなサブタスクに動的に分解し、それぞれが特定の生成されたサブエージェントに割り当てる。 ItineraryBenchは、さまざまな複雑さのタスク間でのメモリ、計画、ツール使用量のエージェントの能力を評価するように設計されている。
論文参考訳（メタデータ） (2024-02-15T18:27:37Z)
AutoAgents: A Framework for Automatic Agent Generation [27.74332323317923]
AutoAgentsは、さまざまなタスクに応じてAIチームを構築するために、複数の専門エージェントを適応的に生成し、コーディネートする革新的なフレームワークである。各種ベンチマーク実験により,AutoAgentsは既存のマルチエージェント手法よりも一貫性と正確な解を生成することが示された。
論文参考訳（メタデータ） (2023-09-29T14:46:30Z)
Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文参考訳（メタデータ） (2020-05-27T01:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。