論文の概要: Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
- arxiv url: http://arxiv.org/abs/2505.22954v1
- Date: Thu, 29 May 2025 00:26:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.594663
- Title: Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
- Title(参考訳): Darwin Godel Machine: 自己改善エージェントのオープンな進化
- Authors: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune,
- Abstract要約: 本稿では,自己改善型AIであるDarwin G"odel Machine(DGM)を紹介する。
ダーウィンの進化とオープンエンドネスの研究に触発されたDGMは、生成されたコーディングエージェントのアーカイブを維持している。
エージェントをサンプリングし、ファンデーションモデルを使用して、サンプルされたエージェントの新しい、興味深いバージョンを作成することで、アーカイブを成長させる。
- 参考スコア(独自算出の注目度): 4.611052333435916
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Today's AI systems have human-designed, fixed architectures and cannot autonomously and continuously improve themselves. The advance of AI could itself be automated. If done safely, that would accelerate AI development and allow us to reap its benefits much sooner. Meta-learning can automate the discovery of novel algorithms, but is limited by first-order improvements and the human design of a suitable search space. The G\"odel machine proposed a theoretical alternative: a self-improving AI that repeatedly modifies itself in a provably beneficial manner. Unfortunately, proving that most changes are net beneficial is impossible in practice. We introduce the Darwin G\"odel Machine (DGM), a self-improving system that iteratively modifies its own code (thereby also improving its ability to modify its own codebase) and empirically validates each change using coding benchmarks. Inspired by Darwinian evolution and open-endedness research, the DGM maintains an archive of generated coding agents. It grows the archive by sampling an agent from it and using a foundation model to create a new, interesting, version of the sampled agent. This open-ended exploration forms a growing tree of diverse, high-quality agents and allows the parallel exploration of many different paths through the search space. Empirically, the DGM automatically improves its coding capabilities (e.g., better code editing tools, long-context window management, peer-review mechanisms), increasing performance on SWE-bench from 20.0% to 50.0%, and on Polyglot from 14.2% to 30.7%. Furthermore, the DGM significantly outperforms baselines without self-improvement or open-ended exploration. All experiments were done with safety precautions (e.g., sandboxing, human oversight). The DGM is a significant step toward self-improving AI, capable of gathering its own stepping stones along paths that unfold into endless innovation.
- Abstract(参考訳): 今日のAIシステムは、人間によって設計された、固定されたアーキテクチャを持ち、自律的かつ継続的に改善することができない。
AIの進歩自体が自動化される可能性がある。
安全に実行すれば、AI開発が加速し、より早くそのメリットを享受できるようになります。
メタラーニングは、新しいアルゴリズムの発見を自動化することができるが、一階改良と適切な検索空間の人間設計によって制限される。
G\"odel machine"は理論的な代替案として、証明可能な方法で自分自身を何度も修正する自己改善型AIを提案した。
残念ながら、ほとんどの変更が純益であることを証明することは、実際には不可能です。
我々は,Darwin G\"odel Machine (DGM)を導入し,コード修正を反復的に行う自己改善システムを紹介した。
ダーウィンの進化とオープンエンドネスの研究にインスパイアされたDGMは、生成されたコーディングエージェントのアーカイブを維持している。
エージェントをサンプリングし、ファンデーションモデルを使用して、サンプルされたエージェントの新しい、興味深いバージョンを作成することで、アーカイブを成長させる。
このオープンエンド探索は、多種多様な高品質なエージェントの生長木を形成し、探索空間を通して様々な経路を並列に探索することを可能にする。
実証的に、DGMはコード編集機能(例えば、より良いコード編集ツール、長いコンテキストのウィンドウ管理、ピアレビュー機構)を自動で改善し、SWEベンチでは20.0%から50.0%に、ポリグロットでは14.2%から30.7%に向上した。
さらに、DGMは自己改善やオープンエンドの探究なしにベースラインを著しく上回っている。
すべての実験は安全対策(例えば、サンドボックス、人間の監視)で行われました。
DGMは自己改善AIへの重要な一歩であり、無限のイノベーションへと展開する道に沿って、独自のステッピングストーンを集めることができる。
関連論文リスト
- R&D-Agent: Automating Data-Driven AI Solution Building Through LLM-Powered Automated Research, Development, and Evolution [60.80016554091364]
R&D-Agentは反復探索のための二重エージェントフレームワークである。
Researcherエージェントはパフォーマンスフィードバックを使用してアイデアを生成し、Developerエージェントはエラーフィードバックに基づいてコードを洗練する。
R&D-AgentはMLE-Benchで評価され、最高のパフォーマンスの機械学習エンジニアリングエージェントとして登場した。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - The Shift from Writing to Pruning Software: A Bonsai-Inspired IDE for Reshaping AI Generated Code [11.149764135999437]
AIによるコーディングアシスタントの台頭は、ソフトウェアの構築方法の根本的な変化を示している。
AIコーディングアシスタントは既存の統合開発環境に統合されているが、その潜在能力の大部分は未完成である。
そこで我々は,従来のファイル構造を使わずに,AIが真に制約のない形式で生成できるIDEの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-03-04T17:57:26Z) - AI Generations: From AI 1.0 to AI 4.0 [3.4440023363051266]
本稿では,人工知能(AI)が複数の世代にまたがって進化していくことを提案する。
これらのAI世代は、アルゴリズム、計算能力、データ間の優先順位のシフトによって駆動される。
人工知能が人間のような自律性に近づいた(あるいはそうしようとする)ときに生じる、深い倫理的、規制的、哲学的な課題を探求する。
論文 参考訳(メタデータ) (2025-02-16T23:19:44Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.94654815220404]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery [14.465756130099091]
本稿では,完全自動科学的発見のための最初の包括的枠組みについて述べる。
我々は、新しい研究アイデアを生成し、コードを書き、実験を実行し、結果を視覚化し、その結果を説明するThe AI Scientistを紹介します。
原則として、このプロセスは、人間の科学コミュニティのように行動しながら、オープンな方法でアイデアを反復的に発展させることができる。
論文 参考訳(メタデータ) (2024-08-12T16:58:11Z) - ProcTHOR: Large-Scale Embodied AI Using Procedural Generation [55.485985317538194]
ProcTHORは、Embodied AI環境の手続き的生成のためのフレームワークである。
ナビゲーション、アレンジメント、アーム操作のための6つの具体化されたAIベンチマークに対して、最先端の結果を実証する。
論文 参考訳(メタデータ) (2022-06-14T17:09:35Z) - An Initial Look at Self-Reprogramming Artificial Intelligence [0.0]
我々は、最初の完全自己プログラミングAIシステムを開発し、実験的に検証する。
AIベースのコンピュータコード生成をAI自体に適用することで、ニューラルネットワークのソースコードを継続的に修正し書き換えるアルゴリズムを実装します。
論文 参考訳(メタデータ) (2022-04-30T05:44:34Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。