論文の概要: ProSEA: Problem Solving via Exploration Agents
- arxiv url: http://arxiv.org/abs/2510.07423v2
- Date: Mon, 13 Oct 2025 06:01:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 13:29:55.674412
- Title: ProSEA: Problem Solving via Exploration Agents
- Title(参考訳): ProSEA: 探索エージェントによる問題解決
- Authors: William Nguyen, Vinh Luong, Christopher Nguyen,
- Abstract要約: 本稿では,探索と計画の進化を通じて反復的な問題解決を実現するために設計されたモジュール型汎用マルチエージェントフレームワークであるProSEAを紹介する。
ProSEAは階層的なアーキテクチャで、管理者エージェントがドメイン固有の専門家エージェントを編成し、タスクを分解し、失敗した試みからの構造化されたフィードバックに基づいて適応的に再計画する。
挑戦的な FinanceBenchベンチマークの実験では、人間からのフィードバックがなくても、ProSEAは最先端のベースラインより優れ、推論に重きを置くタスク全体で堅牢なパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 1.1267979201719025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have empowered AI agents to tackle increasingly complex tasks. However, most existing agents remain limited to static planning and brittle interactions, falling short of true collaboration or adaptive reasoning. We introduce ProSEA, a modular, general-purpose multi-agent framework designed for iterative problem solving through exploration and plan evolution. ProSEA features a hierarchical architecture in which a Manager Agent orchestrates domain-specialized Expert Agents, decomposes tasks, and adaptively replans based on structured feedback from failed attempts. Unlike prior systems, ProSEA agents report not only success or failure but also detailed reasons for failure and newly discovered constraints, enabling dynamic plan refinement informed by exploratory traces. The framework operates autonomously but supports seamless integration with human collaborators when needed. Experiments on the challenging FinanceBench benchmark demonstrate that ProSEA, even without human feedback, outperforms state-of-the-art baselines and achieves robust performance across reasoning-heavy tasks. These results underscore ProSEA's potential as a foundation for more transparent, adaptive, and human-aligned AI agents.
- Abstract(参考訳): 大規模言語モデル(LLM)はAIエージェントに、ますます複雑なタスクに取り組む権限を与えている。
しかし、既存のエージェントのほとんどは静的な計画と不安定な相互作用に限られており、真の協調や適応的推論に欠ける。
本稿では,探索と計画の進化を通じて反復的な問題解決を実現するために設計されたモジュール型汎用マルチエージェントフレームワークであるProSEAを紹介する。
ProSEAは階層的なアーキテクチャで、管理者エージェントがドメイン固有の専門家エージェントを編成し、タスクを分解し、失敗した試みからの構造化されたフィードバックに基づいて適応的に再計画する。
従来のシステムとは異なり、ProSEAエージェントは成功や失敗だけでなく、失敗の詳細な理由や、新たに発見された制約も報告している。
このフレームワークは自律的に動作するが、必要に応じて人間の協力者とのシームレスな統合をサポートする。
挑戦的な FinanceBenchベンチマークの実験では、人間からのフィードバックがなくても、ProSEAは最先端のベースラインより優れ、推論に重きを置くタスク全体で堅牢なパフォーマンスを実現している。
これらの結果は、より透明で適応的で、人間に準拠したAIエージェントの基盤として、ProSEAの可能性を強調している。
関連論文リスト
- Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers [27.817039954088315]
ツールレベルの専門知識を学習するための自己進化型マルチエージェントシステムである textbfGeoEvolver を紹介する。
GeoEvolverはエンドツーエンドのタスクの成功を継続的に改善し、複数のバックボーンで平均12%向上することを示す。
論文 参考訳(メタデータ) (2026-01-30T15:11:07Z) - Beyond Monolithic Architectures: A Multi-Agent Search and Knowledge Optimization Framework for Agentic Search [56.78490647843876]
エージェント検索は、大規模言語モデル(LLM)が推論とツールの使用をインターリーブできるようにすることによって、複雑な情報を探すための有望なパラダイムとして登場した。
本稿では,bfM-ASKを提案する。bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK。
論文 参考訳(メタデータ) (2026-01-08T08:13:27Z) - BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization [41.08366028094234]
大規模言語モデル(LLM)は、現実世界のソフトウェア工学の問題を一般化するのに苦労する。
既存のシステムはワークフロー全体の問題を処理するために、単一のエージェントに依存することが多い。
人間の技術者が複雑な問題を分解する方法に触発され、我々はSWEエージェントをオーケストラとして構成し、特殊なサブエージェントをコーディネートすることを提案する。
論文 参考訳(メタデータ) (2025-12-29T17:41:11Z) - SciAgent: A Unified Multi-Agent System for Generalistic Scientific Reasoning [54.186990494217916]
SciAgentは、一般的な科学的推論のために設計された統合マルチエージェントシステムである。
コーディネータエージェントは、各問題のドメインと複雑性を解釈し、特別なWorker Systemsを動的にオーケストレーションします。
これらの労働者システムは、記号推論、概念モデリング、数値計算、検証のための相互作用的推論サブエージェントで構成されている。
論文 参考訳(メタデータ) (2025-11-11T12:00:34Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - AgentRefine: Enhancing Agent Generalization through Refinement Tuning [28.24897427451803]
LLM(Large Language Model)ベースのエージェントは、人間のような複雑なタスクを実行する能力を示した。
オープンソースLLMとGPTシリーズのような商用モデルの間にはまだ大きなギャップがある。
本稿では,命令チューニングによるLLMのエージェント一般化機能の改善に焦点をあてる。
論文 参考訳(メタデータ) (2025-01-03T08:55:19Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。
本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。
大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - AgentGym: Evolving Large Language Model-based Agents across Diverse Environments [116.97648507802926]
大規模言語モデル(LLM)はそのようなエージェントを構築するための有望な基盤と考えられている。
我々は、自己進化能力を備えた一般機能 LLM ベースのエージェントを構築するための第一歩を踏み出す。
我々はAgentGymを提案する。AgentGymは、幅広い、リアルタイム、ユニフォーマット、並行エージェント探索のための様々な環境とタスクを特徴とする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-06T15:15:41Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。