論文の概要: Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement
- arxiv url: http://arxiv.org/abs/2410.04444v1
- Date: Fri, 18 Oct 2024 01:57:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 07:25:54.542244
- Title: Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement
- Title(参考訳): Gödel Agent: 再帰的自己改善のための自己参照エージェントフレームワーク
- Authors: Xunjian Yin, Xinyi Wang, Liangming Pan, Xiaojun Wan, William Yang Wang,
- Abstract要約: G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
- 参考スコア(独自算出の注目度): 117.94654815220404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid advancement of large language models (LLMs) has significantly enhanced the capabilities of AI-driven agents across various tasks. However, existing agentic systems, whether based on fixed pipeline algorithms or pre-defined meta-learning frameworks, cannot search the whole agent design space due to the restriction of human-designed components, and thus might miss the globally optimal agent design. In this paper, we introduce G\"odel Agent, a self-evolving framework inspired by the G\"odel machine, enabling agents to recursively improve themselves without relying on predefined routines or fixed optimization algorithms. G\"odel Agent leverages LLMs to dynamically modify its own logic and behavior, guided solely by high-level objectives through prompting. Experimental results on mathematical reasoning and complex agent tasks demonstrate that implementation of G\"odel Agent can achieve continuous self-improvement, surpassing manually crafted agents in performance, efficiency, and generalizability.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な進歩により、さまざまなタスクにわたるAI駆動エージェントの能力が大幅に向上した。
しかし、固定パイプラインアルゴリズムや事前定義されたメタラーニングフレームワークをベースとする既存のエージェントシステムは、人間の設計したコンポーネントの制限によりエージェント設計空間全体を探索できないため、グローバルな最適なエージェント設計を見逃す可能性がある。
本稿では,G\"odel Machineにインスパイアされた自己進化型フレームワークであるG\"odel Agentを紹介する。
G\"odel Agent"はLSMを活用して、プロンプトを通じて高レベルな目的のみによってガイドされる、自身のロジックと振る舞いを動的に変更する。
数学的推論および複雑なエージェントタスクの実験結果は、G\"odel Agent"の実装が連続的な自己改善を実現し、パフォーマンス、効率、一般化性において手作業によるエージェントを超越することを示した。
関連論文リスト
- Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.084974125007165]
本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。
Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。
Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-11-07T06:36:19Z) - Agent-as-a-Judge: Evaluate Agents with Agents [61.33974108405561]
本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文 参考訳(メタデータ) (2024-10-14T17:57:02Z) - Textualized Agent-Style Reasoning for Complex Tasks by Multiple Round LLM Generation [49.27250832754313]
我々は、llmベースの自律エージェントフレームワークであるAgentCOTを紹介する。
それぞれのステップで、AgentCOTはアクションを選択し、それを実行して、証拠を裏付ける中間結果を得る。
エージェントCOTの性能を高めるための2つの新しい戦略を導入する。
論文 参考訳(メタデータ) (2024-09-19T02:20:06Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは進化的アルゴリズムによって専門家エージェントをマルチエージェントシステムに自動的に拡張する汎用的な手法である。
EvoAgentは複数の専門家エージェントを自動生成し,LLMエージェントのタスク解決能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-20T11:49:23Z) - AgentGym: Evolving Large Language Model-based Agents across Diverse Environments [116.97648507802926]
大規模言語モデル(LLM)はそのようなエージェントを構築するための有望な基盤と考えられている。
我々は、自己進化能力を備えた一般機能 LLM ベースのエージェントを構築するための第一歩を踏み出す。
我々はAgentGymを提案する。AgentGymは、幅広い、リアルタイム、ユニフォーマット、並行エージェント探索のための様々な環境とタスクを特徴とする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-06T15:15:41Z) - Self-Organized Agents: A LLM Multi-Agent Framework toward Ultra Large-Scale Code Generation and Optimization [0.8057006406834466]
自己組織化マルチエージェントフレームワーク(SoA)は、大規模コードのスケーラブルで効率的な生成と最適化を可能にする新しいマルチエージェントフレームワークである。
私たちのフレームワークの主な特徴は、問題複雑性に基づいたエージェントの自動乗算であり、動的スケーラビリティを可能にします。
我々は、HumanEvalベンチマーク上でSoAを評価し、シングルエージェントシステムと比較して、SoA内の各エージェントがコード処理をかなり少なくするが、全体的なコード生成量は大幅に大きいことを示した。
論文 参考訳(メタデータ) (2024-04-02T13:37:28Z) - S-Agents: Self-organizing Agents in Open-ended Environments [15.700383873385892]
動的ワークフローのための「エージェントのツリー」構造を持つ自己組織化エージェントシステム(S-Agents)を導入する。
この構造はエージェントのグループを自律的に調整することができ、オープン環境と動的環境の課題に効率的に対処することができる。
実験の結果,S-AgentsはMinecraft環境において協調的な建築作業や資源収集を行うことができた。
論文 参考訳(メタデータ) (2024-02-07T04:36:31Z) - Formally Specifying the High-Level Behavior of LLM-Based Agents [24.645319505305316]
LLMはタスク固有の微調整モデルを必要とせずに、課題を解決するための有望なツールとして登場した。
現在、このようなエージェントの設計と実装はアドホックであり、LLMベースのエージェントが自然に適用できる様々なタスクは、エージェント設計に一律に適合するアプローチが存在しないことを意味する。
エージェント構築のプロセスを簡単にする最小主義的生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-12T17:24:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。