Fugu-MT 論文翻訳(概要): Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

論文の概要: Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution

arxiv url: http://arxiv.org/abs/2505.20286v1
Date: Mon, 26 May 2025 17:58:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-28 14:37:20.448437
Title: Alita: Generalist Agent Enabling Scalable Agentic Reasoning with Minimal Predefinition and Maximal Self-Evolution
Title（参考訳）: Alita: 最小限の事前定義と最大自己進化によるスケーラブルなエージェント推論を実現する汎用エージェント
Authors: Jiahao Qiu, Xuan Qi, Tongcheng Zhang, Xinzhe Juan, Jiacheng Guo, Yifu Lu, Yimin Wang, Zixin Yao, Qihan Ren, Xun Jiang, Xing Zhou, Dongrui Liu, Ling Yang, Yue Wu, Kaixuan Huang, Shilong Liu, Hongru Wang, Mengdi Wang,
Abstract要約: 本稿では,「単純さは究極的洗練」の原理を取り入れた一般エージェント「アリタ」を紹介する。最小限の事前定義のために、Alitaは直接問題解決のための1つのコンポーネントのみを備えており、従来のアプローチよりもずっとシンプルで簡潔である。最大自己進化のためには、汎用コンポーネントのスイートを提供することで、Alitaの創造性を実現する。
参考スコア（独自算出の注目度）: 37.521638711049135
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent advances in large language models (LLMs) have enabled agents to autonomously perform complex, open-ended tasks. However, many existing frameworks depend heavily on manually predefined tools and workflows, which hinder their adaptability, scalability, and generalization across domains. In this work, we introduce Alita--a generalist agent designed with the principle of "Simplicity is the ultimate sophistication," enabling scalable agentic reasoning through minimal predefinition and maximal self-evolution. For minimal predefinition, Alita is equipped with only one component for direct problem-solving, making it much simpler and neater than previous approaches that relied heavily on hand-crafted, elaborate tools and workflows. This clean design enhances its potential to generalize to challenging questions, without being limited by tools. For Maximal self-evolution, we enable the creativity of Alita by providing a suite of general-purpose components to autonomously construct, refine, and reuse external capabilities by generating task-related model context protocols (MCPs) from open source, which contributes to scalable agentic reasoning. Notably, Alita achieves 75.15% pass@1 and 87.27% pass@3 accuracy, which is top-ranking among general-purpose agents, on the GAIA benchmark validation dataset, 74.00% and 52.00% pass@1, respectively, on Mathvista and PathVQA, outperforming many agent systems with far greater complexity. More details will be updated at $\href{https://github.com/CharlesQ9/Alita}{https://github.com/CharlesQ9/Alita}$.
Abstract（参考訳）: 大規模言語モデル(LLM)の最近の進歩により、エージェントは複雑でオープンなタスクを自律的に実行できるようになった。しかし、既存のフレームワークの多くは、手動で定義されたツールやワークフローに大きく依存しており、ドメイン間の適応性、スケーラビリティ、一般化を妨げる。本研究では,「シンプルさは究極的洗練」の原理を取り入れた汎用エージェントであるAlitaを導入し,最小限の事前定義と最大自己進化によるスケーラブルなエージェント推論を実現する。最小限の事前定義のために、Alitaは直接問題解決のためのコンポーネントを1つだけ備えており、手作りで精巧なツールやワークフローに大きく依存する従来のアプローチよりもずっとシンプルで簡潔である。このクリーンなデザインは、ツールによって制限されることなく、挑戦的な問題に一般化する可能性を高める。最大自己進化のためには、オープンソースからタスク関連モデルコンテキストプロトコル(MCP)を生成することにより、外部機能を自律的に構築、洗練、再利用するための汎用コンポーネントセットを提供することで、Alitaの創造性を実現し、スケーラブルなエージェント推論に寄与する。特に、Alitaは、GAIAベンチマーク検証データセットの74.00%、52.00%、MathvistaとPathVQAで75.15%のpass@1と87.27%のpass@3の精度を達成した。詳細は$\href{https://github.com/CharlesQ9/Alita}{https://github.com/CharlesQ9/Alita}$で更新される。

関連論文リスト

Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [72.44384066166147]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文参考訳（メタデータ） (2025-07-24T09:17:41Z)
CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs [16.234259194402163]
マルチエージェント推論を符号化し、マルチエージェントシステムにおける構造化されたトークン効率の計画を可能にするプロンプトフレームワークであるCodeAgentsを紹介する。その結果, 計画性能は一貫した改善がみられ, 基本となる自然言語よりも3～36ポイントの絶対的な向上が見られた。
論文参考訳（メタデータ） (2025-07-04T02:20:19Z)
Coding Agents with Multimodal Browsing are Generalist Problem Solvers [48.938445118630284]
OpenHands-Versaは、控えめな多くの汎用ツールで構築された汎用AIエージェントである。既存の最先端マルチエージェントシステムは、ターゲットドメインを超えて一般化できないことを示す。
論文参考訳（メタデータ） (2025-06-03T15:50:55Z)
MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。 MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文参考訳（メタデータ） (2025-05-21T00:56:09Z)
AppAgentX: Evolving GUI Agents as Proficient Smartphone Users [34.70342284525283]
本稿では,インテリジェンスと柔軟性を維持しつつ,操作効率を向上させるGUIエージェントの進化的フレームワークを提案する。本手法は,エージェントのタスク実行履歴を記録するメモリ機構を組み込んだものである。複数のベンチマークタスクに対する実験結果から,本手法は既存の手法よりも効率と精度が優れていることが示された。
論文参考訳（メタデータ） (2025-03-04T04:34:09Z)
Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.084974125007165]
本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。 Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。 Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文参考訳（メタデータ） (2024-11-07T06:36:19Z)
Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.94654815220404]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。 G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文参考訳（メタデータ） (2024-10-06T10:49:40Z)
EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。 EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2024-06-20T11:49:23Z)
HAMMR: HierArchical MultiModal React agents for generic VQA [27.78721140495953]
計数,空間的推論,OCRに基づく推論,視覚的ポインティング,外部知識など,様々なVQAタスクスイート上でシステムを評価する。マルチモーダルなReActベースのシステムから始まり、HAMMRエージェントが他の特殊なエージェントを呼び出せるようにすることで、階層的にします。具体的には、我々の一般的なVQAスイートでは、HAMMRは単純LLM+ツールのアプローチを19.5%上回っている。
論文参考訳（メタデータ） (2024-04-08T12:43:32Z)
Self-Organized Agents: A LLM Multi-Agent Framework toward Ultra Large-Scale Code Generation and Optimization [0.8057006406834466]
自己組織化マルチエージェントフレームワーク(SoA)は、大規模コードのスケーラブルで効率的な生成と最適化を可能にする新しいマルチエージェントフレームワークである。私たちのフレームワークの主な特徴は、問題複雑性に基づいたエージェントの自動乗算であり、動的スケーラビリティを可能にします。我々は、HumanEvalベンチマーク上でSoAを評価し、シングルエージェントシステムと比較して、SoA内の各エージェントがコード処理をかなり少なくするが、全体的なコード生成量は大幅に大きいことを示した。
論文参考訳（メタデータ） (2024-04-02T13:37:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。