論文の概要: Agentic Lybic: Multi-Agent Execution System with Tiered Reasoning and Orchestration
- arxiv url: http://arxiv.org/abs/2509.11067v1
- Date: Sun, 14 Sep 2025 03:22:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.895105
- Title: Agentic Lybic: Multi-Agent Execution System with Tiered Reasoning and Orchestration
- Title(参考訳): エージェントリビック:タイアード推論とオーケストレーションによるマルチエージェント実行システム
- Authors: Liangxuan Guo, Bin Zhu, Qingqian Tao, Kangning Liu, Xun Zhao, Xianzhe Qin, Jin Gao, Guangfu Hao,
- Abstract要約: textscAgentic Lybicは、アーキテクチャ全体が有限状態機械(FSM)として動作する新しいマルチエージェントシステムである
我々は,TextscAgentic Lybicが50ステップで57.07%の成功率を達成し,既存の手法を大幅に上回っていることを示す。
- 参考スコア(独自算出の注目度): 21.929452003961927
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agents for desktop automation struggle with complex multi-step tasks due to poor coordination and inadequate quality control. We introduce \textsc{Agentic Lybic}, a novel multi-agent system where the entire architecture operates as a finite-state machine (FSM). This core innovation enables dynamic orchestration. Our system comprises four components: a Controller, a Manager, three Workers (Technician for code-based operations, Operator for GUI interactions, and Analyst for decision support), and an Evaluator. The critical mechanism is the FSM-based routing between these components, which provides flexibility and generalization by dynamically selecting the optimal execution strategy for each subtask. This principled orchestration, combined with robust quality gating, enables adaptive replanning and error recovery. Evaluated officially on the OSWorld benchmark, \textsc{Agentic Lybic} achieves a state-of-the-art 57.07\% success rate in 50 steps, substantially outperforming existing methods. Results demonstrate that principled multi-agent orchestration with continuous quality control provides superior reliability for generalized desktop automation in complex computing environments.
- Abstract(参考訳): デスクトップ自動化のための自律エージェントは、調整が不十分で品質管理が不十分なため、複雑なマルチステップタスクに苦労する。
アーキテクチャ全体が有限状態機械(FSM)として動作する新しいマルチエージェントシステムであるtextsc{Agentic Lybic} を紹介する。
この中核的なイノベーションは動的オーケストレーションを可能にする。
システムには,コントローラ,マネージャ,ワーカ(コードベース操作の技術者,GUIインタラクションのオペレータ,意思決定支援のアナリスト)と評価器の4つのコンポーネントがある。
重要なメカニズムは、これらのコンポーネント間のFSMベースのルーティングであり、各サブタスクに対して最適な実行戦略を動的に選択することで、柔軟性と一般化を提供する。
この原則によるオーケストレーションは、堅牢な品質ゲーティングと組み合わせて、適応的な再計画とエラー回復を可能にする。
OSWorldベンチマークで公式に評価された \textsc{Agentic Lybic} は、50ステップで最先端の57.07\%の成功率を達成し、既存の手法を大幅に上回っている。
その結果, マルチエージェントオーケストレーションと継続的品質制御の原則が, 複雑な計算環境において, 汎用デスクトップ自動化の信頼性を向上することを示した。
関連論文リスト
- AgentOrchestra: A Hierarchical Multi-Agent Framework for General-Purpose Task Solving [28.87376403573416]
本稿では,汎用タスク解決のための階層型マルチエージェントフレームワークであるAgentOrchestraを紹介する。
複雑な目的を分解し、サブタスクを専門エージェントのチームに委譲する中央計画エージェントが特徴である。
LLMをベースとしたエージェントシステムを評価するために,このフレームワークを3つの広く使用されているベンチマークで評価する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - Multi-Agent Collaboration via Evolving Orchestration [61.93162413517026]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMをベースとしたマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し、中央オーケストレータがタスク状態の進化に応じてエージェントを動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - OmniNova:A General Multimodal Agent Framework [0.5439020425819]
特殊なツールを備えた大規模言語モデル(LLM)は、インテリジェントな自動化システムに新たな機会をもたらす。
OmniNovaはモジュール型のマルチエージェント自動化フレームワークで、言語モデルとWeb検索、クローリング、コード実行機能といった特殊なツールを組み合わせる。
論文 参考訳(メタデータ) (2025-03-25T19:21:01Z) - Autonomous Deep Agent [0.7489814067742621]
Deep Agentは、複雑なマルチフェーズタスクを管理するために設計された高度な自律AIシステムである。
システムの基盤は階層型タスクDAGフレームワーク上に構築されています。
Deep Agentは、自己管理型AIシステムにおいて、新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-02-10T21:46:54Z) - Multi-agent Architecture Search via Agentic Supernet [17.235963703597093]
大規模言語モデル(LLM)を利用したマルチエージェントシステムは、個々のエージェントの認知的境界を拡張する。
エージェントの設計を自動化する方法が利用可能であるにもかかわらず、彼らは通常、静的で複雑で、1サイズに適したシステムを見つけ出そうとする。
スーパーネットからクエリ依存エージェントシステムをサンプリングする自動フレームワークであるMASを紹介する。
論文 参考訳(メタデータ) (2025-02-06T16:12:06Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。
本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。
大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。