論文の概要: GEAR: Genetic AutoResearch for Agentic Code Evolution
- arxiv url: http://arxiv.org/abs/2605.13874v1
- Date: Fri, 08 May 2026 00:25:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.392497
- Title: GEAR: Genetic AutoResearch for Agentic Code Evolution
- Title(参考訳): GEAR: エージェントコード進化のための遺伝的オートリサーチ
- Authors: Ahmadreza Jeddi, Minh Ngoc Le, Hakki C. Karaimer, Konstantinos G. Derpanis, Babak Taati,
- Abstract要約: GEAR(英: Genetic AutoResearch、遺伝子自動検索)は、単一パス検索を、複数の研究状況における集団ベースの検索に置き換える。
強力な候補ソリューションのセットを保持し、生産性、ノベルティ、カバレッジに基づいて両親を選択し、突然変異と交叉を通じて新しいアイデアを探求する。
本稿では,GEARの3つのバージョンについて検討する。1つはプロンプトによって制御され,もう1つはプログラム型検索コントローラを使用し,もう1つは実行中にコントローラ自体を進化させることができる。
- 参考スコア(独自算出の注目度): 11.641689406945202
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous research agents can already run machine learning experiments without human supervision, but many rely on a narrow search strategy: they repeatedly modify one program and keep changes only when they improve the current best result. This can cause them to discard useful partial ideas, alternative promising directions, and insights from failed or incomplete experiments. GEAR, or Genetic AutoResearch, replaces this single-path search with a population-based search over multiple research states. It keeps a set of strong candidate solutions, selects parents based on productivity, novelty, and coverage, and explores new ideas through mutation and crossover. Each research state stores its code changes, reflections, and performance data, allowing future decisions to build on past discoveries. The paper studies three versions of GEAR: one controlled through prompting, one using a fixed programmatic search controller, and one where the controller itself can evolve during the run. Under the same compute budget and environment, all three versions outperform the AutoResearch baseline. More importantly, while the baseline tends to settle into one local optimum, GEAR continues finding improvements over longer runs. Overall, the results suggest that autonomous research agents become more effective when they maintain multiple promising directions and can adapt their search strategy over time.
- Abstract(参考訳): 自律的な研究エージェントはすでに人間の監督なしに機械学習の実験を実行できるが、多くは狭い探索戦略に依存している。
このことは、有用な部分的アイデア、代替の有望な方向、失敗または不完全な実験からの洞察を捨てる原因となる。
GEAR(Genematic AutoResearch)は、このシングルパス検索を、複数の研究状況における人口ベースの検索に置き換える。
強力な候補ソリューションのセットを保持し、生産性、ノベルティ、カバレッジに基づいて両親を選択し、突然変異と交叉を通じて新しいアイデアを探求する。
各リサーチステートは、コードの変更、リフレクション、パフォーマンスデータを格納し、過去の発見に基づいて将来の決定を構築できる。
本稿では,GEARの3つのバージョンについて検討する。1つはプロンプトによって制御され,もう1つはプログラム型検索コントローラを使用し,もう1つは実行中にコントローラ自体を進化させることができる。
同じ計算予算と環境下では、3つのバージョンがAutoResearchベースラインを上回っている。
さらに重要なのは、ベースラインが1つのローカルな最適化に落ち着く傾向にある一方で、GEARは長い実行よりも改善点を見つけ続けていることだ。
全体としては、自律的な研究エージェントは、複数の有望な方向を維持することでより効果的になり、時間とともに検索戦略に適応できることが示唆されている。
関連論文リスト
- NanoResearch: Co-Evolving Skills, Memory, and Policy for Personalized Research Automation [59.00873435874659]
LLMを利用したマルチエージェントシステムは、アイデアから論文執筆までの完全な研究パイプラインを自動化できるようになったが、根本的な疑問が残る。
我々は,三段階共進化によってこれらのギャップに対処するマルチエージェントフレームワークであるNanoResearchを提案する。
技能銀行は、繰り返しの業務をプロジェクト間で再利用可能なコンパクトな手続き規則に蒸留する。
メモリモジュールは、各ユーザの研究履歴における計画決定の基礎となる、ユーザとプロジェクト特有のエクスペリエンスを維持します。
ラベルフリーポリシー学習は、自由形式のフィードバックをプランナーの永続パラメータ更新に変換し、その後の調整を再構築する。
論文 参考訳(メタデータ) (2026-05-11T16:33:47Z) - CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery [67.47220507982522]
大規模言語モデル(LLM)ベースの進化は、オープンな発見のための有望なアプローチである。
オープンエンド問題における自律的マルチエージェント進化のための最初のフレームワークであるCORALを紹介する。
コーラルは、厳格な制御を長期にわたるエージェントに置き換え、探索し、反射し、協力する。
論文 参考訳(メタデータ) (2026-04-02T05:59:06Z) - EvoX: Meta-Evolution for Automated Discovery [115.89434419482797]
EvoXは、独自の進化過程を最適化する適応進化法である。
進捗に応じて、事前のソリューションが選択され、どのように変化するかを継続的に更新する。
AlphaEvolve, OpenEvolve, GEPA, ShinkaEvolveなどの既存のAI駆動の進化的手法を、タスクの大部分で上回っている。
論文 参考訳(メタデータ) (2026-02-26T18:54:41Z) - OR-Agent: Bridging Evolutionary Search and Structured Research for Automated Algorithm Discovery [10.217363774023033]
OR-Agentは、リッチな実験環境における自動探査のために設計されたマルチエージェントの研究フレームワークである。
本稿では,研究開始点の進化的選択,総合的な研究計画生成,研究ツリー内の協調探索を統一する進化的システム機構を提案する。
我々は古典的最適化ベンチマーク(走行セールスマン、静電容量化車両ルーティング、ビンパッキング、オリエンテーリング、および複数のクナップサック問題を含む)およびシミュレーションに基づく協調運転シナリオを含む実験を行う。
論文 参考訳(メタデータ) (2026-02-14T13:32:03Z) - From Reproduction to Replication: Evaluating Research Agents with Progressive Code Masking [48.90371827091671]
AutoExperimentは、AIエージェントの機械学習実験の実装と実行能力を評価するベンチマークである。
我々は最先端のエージェントを評価し、n$が増加するにつれて性能が急速に低下することを発見した。
本研究は、長期コード生成、文脈検索、自律的な実験実行における重要な課題を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-24T15:39:20Z) - WebRollback: Enhancing Web Agents with Explicit Rollback Mechanisms [52.942566473658054]
我々は、明示的なロールバック機構でWebエージェントを強化し、エージェントがナビゲーションの軌跡の前の状態に戻れるようにした。
このメカニズムは、モデルに検索プロセスを直接制御する柔軟性を与え、効果的で効率的なWebナビゲーション方法をもたらす。
論文 参考訳(メタデータ) (2025-04-16T05:41:20Z) - Reinforcement learning informed evolutionary search for autonomous
systems testing [15.210312666486029]
本稿では,ドメイン知識から得られるサロゲート報酬を用いて学習した強化学習(RL)エージェントを用いて進化的探索(ES)を強化することを提案する。
RIGAAとして知られる我々の手法では、まずRLエージェントを訓練し、問題の有用な制約を学習し、それを用いて探索アルゴリズムの初期集団の特定の部分を生成する。
RIGAAは自律性アリロボットの迷路生成と自律車線維持支援システムの道路トポロジー生成の2つのケーススタディで評価した。
論文 参考訳(メタデータ) (2023-08-24T13:11:07Z) - A suite of diagnostic metrics for characterizing selection schemes [45.74830585715129]
DOSSIERは、8つの手作りメトリクスからなる診断スイートである。
これらのメトリクスは、エクスプロイト、探索、およびそれらの相互作用のために、実験的に特定の能力を測定するように設計されている。
DOSSIERを6つの一般的な選択スキームに適用する: トランケーション、トーナメント、フィットネス共有、レキシケース、非支配的なソート、ノベルティ検索。
論文 参考訳(メタデータ) (2022-04-29T01:05:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。