論文の概要: Analyzing Information Sharing and Coordination in Multi-Agent Planning
- arxiv url: http://arxiv.org/abs/2508.12981v1
- Date: Mon, 18 Aug 2025 14:57:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:11.386649
- Title: Analyzing Information Sharing and Coordination in Multi-Agent Planning
- Title(参考訳): マルチエージェント計画における情報共有とコーディネーションの分析
- Authors: Tianyue Ou, Saujas Vaduguru, Daniel Fried,
- Abstract要約: マルチエージェントシステム(MAS)は、Web研究やソフトウェア工学といった分野において、大きな言語モデル(LLM)エージェントの境界を推し進めている。
本研究では,これらの課題を代表した旅行計画タスクのためのLLMベースのMASを構築する。
このノートは、幻覚された詳細によるエラーを18%削減し、オーケストレータはMASにフォーカスするよう指示し、フォーカスされたサブエリア内で最大13.5%のエラーを削減させる。
- 参考スコア(独自算出の注目度): 14.051712312002154
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Multi-agent systems (MASs) have pushed the boundaries of large language model (LLM) agents in domains such as web research and software engineering. However, long-horizon, multi-constraint planning tasks involve conditioning on detailed information and satisfying complex interdependent constraints, which can pose a challenge for these systems. In this study, we construct an LLM-based MAS for a travel planning task which is representative of these challenges. We evaluate the impact of a notebook to facilitate information sharing, and evaluate an orchestrator agent to improve coordination in free form conversation between agents. We find that the notebook reduces errors due to hallucinated details by 18%, while an orchestrator directs the MAS to focus on and further reduce errors by up to 13.5% within focused sub-areas. Combining both mechanisms achieves a 25% final pass rate on the TravelPlanner benchmark, a 17.5% absolute improvement over the single-agent baseline's 7.5% pass rate. These results highlight the potential of structured information sharing and reflective orchestration as key components in MASs for long horizon planning with LLMs.
- Abstract(参考訳): マルチエージェントシステム(MAS)は、Web研究やソフトウェア工学といった分野において、大きな言語モデル(LLM)エージェントの境界を推し進めている。
しかし、長期のマルチ制約計画タスクは、詳細な情報を条件付けし、複雑な相互依存制約を満たすことを含み、これらのシステムに課題を生じさせる可能性がある。
本研究では,これらの課題を代表した旅行計画タスクのためのLLMベースのMASを構築する。
情報共有を容易にするためのノートブックの効果を評価し,エージェント間の自由形式の会話におけるコーディネーションを改善するためのオーケストレータエージェントを評価した。
このノートは、幻覚された詳細によるエラーを18%削減し、オーケストレータはMASにフォーカスするよう指示し、フォーカスされたサブエリア内で最大13.5%のエラーを削減させる。
両方のメカニズムを組み合わせることで、TravelPlannerベンチマークの25%の最終パスレートを実現し、シングルエージェントベースラインの7.5%パスレートよりも17.5%絶対的な改善を実現している。
これらの結果は,LLMを用いた長期水平計画のためのMASにおいて,構造化情報共有と反射オーケストレーションが鍵となる可能性を強調した。
関連論文リスト
- MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Why Do Multi-Agent LLM Systems Fail? [91.39266556855513]
MAST(Multi-Agent System Failure taxonomy, MAST)は,MASの故障を理解するために考案された分類法である。
我々は、200以上のタスクにまたがる7つの人気のあるMASフレームワークを分析し、6つの専門家のアノテータを含む。
14のユニークな障害モードを特定し、(i)仕様問題、(ii)エージェント間ミスアライメント、(iii)タスク検証の3つに分類した。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z) - PARTNR: A Benchmark for Planning and Reasoning in Embodied Multi-agent Tasks [57.89516354418451]
我々は,HumaN-Robotコラボレーション(PARTNR)における計画と推論タスクのベンチマークを示す。
大規模言語モデル(LLM)を用いた半自動タスク生成パイプラインを用いる。
我々は、計画、知覚、スキル実行の軸を越えて、PartinNRタスクにおける最先端のLCMを分析します。
論文 参考訳(メタデータ) (2024-10-31T17:53:12Z) - Planning with Multi-Constraints via Collaborative Language Agents [13.550774629515843]
本稿では,協調型マルチエージェントシステムのためのゼロショット手法であるPMC(Planning with Multi-Constraints)を紹介する。
PMCは、制約で複雑なタスク計画を簡単にし、従属タスクの階層に分解する。
PMCはTravelPlannerで平均42.68%の成功率を記録し、GPT-4 (2.92%) をはるかに上回り、API-BankでReActを13.64%上回った。
論文 参考訳(メタデータ) (2024-05-26T10:33:17Z) - MASP: Scalable GNN-based Planning for Multi-Agent Navigation [18.70078556851899]
Multi-Agent Scalable Graph-based Planner (MASP)は、ナビゲーションタスクのためのゴール条件付き階層型プランナーである。
MASPは、大規模な探索空間を複数の目標条件付き部分空間に分解することで、空間の複雑さを低減するために階層的なフレームワークを採用している。
エージェントの協力とさまざまなチームサイズへの適応のために、エージェントと目標をグラフとしてモデル化し、それらの関係をよりよく捉えます。
論文 参考訳(メタデータ) (2023-12-05T06:05:04Z) - TaskLAMA: Probing the Complex Task Understanding of Language Models [13.336015994186955]
構造化複雑タスク分解(Structured Complex Task Decomposition, SCTD)は、複雑な現実世界のタスクを、タスク達成に寄与する個々のステップ上の有向非巡回グラフに分解する問題である。
我々は,Large Language Models (LLMs) から抽出した知識を用いて,SCTDの精度を検証した。
実験の結果,LLMは複雑なタスクを個々のステップに効果的に分解できることがわかった。
論文 参考訳(メタデータ) (2023-08-29T13:36:45Z) - Plan, Eliminate, and Track -- Language Models are Good Teachers for
Embodied Agents [99.17668730578586]
事前訓練された大言語モデル(LLM)は、世界に関する手続き的な知識をキャプチャする。
Plan, Eliminate, and Track (PET)フレームワークはタスク記述をハイレベルなサブタスクのリストに変換する。
PETフレームワークは、人間の目標仕様への一般化のために、SOTAよりも15%改善されている。
論文 参考訳(メタデータ) (2023-05-03T20:11:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。