論文の概要: Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution
- arxiv url: http://arxiv.org/abs/2505.20286v1
- Date: Mon, 26 May 2025 17:58:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 14:37:20.448437
- Title: Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution
- Title(参考訳): Alita: 最小限の事前定義と最大自己進化によるスケーラブルなエージェント推論を実現する汎用エージェント
- Authors: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang,
- Abstract要約: 本稿では,「単純さは究極的洗練」の原理を取り入れた一般エージェント「アリタ」を紹介する。
最小限の事前定義のために、Alitaは直接問題解決のための1つのコンポーネントのみを備えており、従来のアプローチよりもずっとシンプルで簡潔である。
最大自己進化のためには、汎用コンポーネントのスイートを提供することで、Alitaの創造性を実現する。
- 参考スコア(独自算出の注目度): 37.521638711049135
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at $\href{https://github.com/CharlesQ9/Alita}{https://github.com/CharlesQ9/Alita}$.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩により、エージェントは複雑でオープンなタスクを自律的に実行できるようになった。
しかし、既存のフレームワークの多くは、手動で定義されたツールやワークフローに大きく依存しており、ドメイン間の適応性、スケーラビリティ、一般化を妨げる。
本研究では,「シンプルさは究極的洗練」の原理を取り入れた汎用エージェントであるAlitaを導入し,最小限の事前定義と最大自己進化によるスケーラブルなエージェント推論を実現する。
最小限の事前定義のために、Alitaは直接問題解決のためのコンポーネントを1つだけ備えており、手作りで精巧なツールやワークフローに大きく依存する従来のアプローチよりもずっとシンプルで簡潔である。
このクリーンなデザインは、ツールによって制限されることなく、挑戦的な問題に一般化する可能性を高める。
最大自己進化のためには、オープンソースからタスク関連モデルコンテキストプロトコル(MCP)を生成することにより、外部機能を自律的に構築、洗練、再利用するための汎用コンポーネントセットを提供することで、Alitaの創造性を実現し、スケーラブルなエージェント推論に寄与する。
特に、Alitaは、GAIAベンチマーク検証データセットの74.00%、52.00%、MathvistaとPathVQAで75.15%のpass@1と87.27%のpass@3の精度を達成した。
詳細は$\href{https://github.com/CharlesQ9/Alita}{https://github.com/CharlesQ9/Alita}$で更新される。
関連論文リスト
- MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - AppAgentX: Evolving GUI Agents as Proficient Smartphone Users [34.70342284525283]
本稿では,インテリジェンスと柔軟性を維持しつつ,操作効率を向上させるGUIエージェントの進化的フレームワークを提案する。
本手法は,エージェントのタスク実行履歴を記録するメモリ機構を組み込んだものである。
複数のベンチマークタスクに対する実験結果から,本手法は既存の手法よりも効率と精度が優れていることが示された。
論文 参考訳(メタデータ) (2025-03-04T04:34:09Z) - Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.084974125007165]
本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。
Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。
Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-11-07T06:36:19Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.94654815220404]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - HAMMR: HierArchical MultiModal React agents for generic VQA [27.78721140495953]
計数,空間的推論,OCRに基づく推論,視覚的ポインティング,外部知識など,様々なVQAタスクスイート上でシステムを評価する。
マルチモーダルなReActベースのシステムから始まり、HAMMRエージェントが他の特殊なエージェントを呼び出せるようにすることで、階層的にします。
具体的には、我々の一般的なVQAスイートでは、HAMMRは単純LLM+ツールのアプローチを19.5%上回っている。
論文 参考訳(メタデータ) (2024-04-08T12:43:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。