論文の概要: TurboEvolve: Towards Fast and Robust LLM-Driven Program Evolution
- arxiv url: http://arxiv.org/abs/2604.18607v1
- Date: Sun, 12 Apr 2026 12:42:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.347153
- Title: TurboEvolve: Towards Fast and Robust LLM-Driven Program Evolution
- Title(参考訳): TurboEvolve: 高速かつロバストなLCM駆動プログラム進化を目指す
- Authors: Yang Yang, Zining Zhong, Jindong Li, Jiemin Wu, Kaishen Yuan, Wenshuo Chen, Menglin Yang, Yutao Yue,
- Abstract要約: TurboEvolveは、固定評価予算の下でサンプル効率とロバスト性を改善するマルチ島進化フレームワークである。
進化的アルゴリズムにおける多重子孫戦略に触発されたTurboEvolveは、言語化されたサンプリングを導入した。
既存のソリューションプールを活用するために,シードプールインジェクション(seed-pool Injection)を提案する。
- 参考スコア(独自算出の注目度): 8.845934077634187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-driven program evolution can discover high-quality programs, but its cost and run-to-run variance hinder reliable progress. We propose TurboEvolve, a multi-island evolutionary framework that improves sample efficiency and robustness under fixed evaluation budgets. Inspired by the multiple-offspring strategy in evolutionary algorithms, TurboEvolve introduces verbalized Sampling, prompting the LLM to emit K diverse candidates with explicit self-assigned sampling weights, and an online scheduler that adapts K to expand exploration under stagnation and reduce overhead during steady progress. To exploit existing solution pools, we further propose "seed-pool injection," which clusters seeds and assigns them across islands with controlled perturbations and elitist preservation to balance diversity and refinement. Across multiple program-optimization benchmarks, TurboEvolve consistently achieves stronger performance at lower budgets and improves best-known solutions on several tasks.
- Abstract(参考訳): LLMによるプログラム進化は、高品質なプログラムを発見できるが、そのコストと実行時の分散は、信頼性を損なう。
提案するTurboEvolveは,固定評価予算下でサンプル効率とロバスト性を向上させる多島間進化フレームワークである。
進化的アルゴリズムにおける多重子孫戦略に触発されたTurboEvolveは、言語化されたサンプリングを導入し、LLMは明示的な自己割り当てサンプリング重み付きKの候補を出力する。
既存のソリューションプールを活用するため,我々は,多様性と洗練のバランスをとるために,制御された摂動とエリート主義保存を備えた島々に種をクラスターし,それらを割り当てる「シードプール注入」についても提案する。
複数のプログラム最適化ベンチマークを通じて、TurboEvolveは一貫して低い予算でパフォーマンスを向上し、いくつかのタスクでよく知られたソリューションを改善している。
関連論文リスト
- AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization [61.535567824938205]
本稿では,LLMによる進化を階層的適応最適化問題として再構成するフレームワークであるAdaEvolveを紹介する。
AdaEvolveは185の異なるオープンエンド最適化問題において、オープンエンドベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-23T18:45:31Z) - PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution [64.15555230987222]
PACEvolveはエージェントのコンテキストと検索ダイナミクスを堅牢に管理するように設計されたフレームワークである。
PACEvolveは、一貫性のある長期自己改善のための体系的なパスを提供する。
論文 参考訳(メタデータ) (2026-01-15T18:25:23Z) - EvoLattice: Persistent Internal-Population Evolution through Multi-Alternative Quality-Diversity Graph Representations for LLM-Guided Program Discovery [2.1756081703276]
EvoLatticeは、単一の非巡回グラフ内の候補プログラムやエージェントの行動の全集団を表すフレームワークである。
各ノードは複数の永続的な選択肢を格納し、グラフを通る有効なパスは、それぞれ別の候補を定義する。
EvoLatticeは、ローカルデザインの選択がグローバルパフォーマンスにどのように影響するかを示す統計データを生成する。
論文 参考訳(メタデータ) (2025-12-15T19:43:06Z) - Experience-Guided Reflective Co-Evolution of Prompts and Heuristics for Automatic Algorithm Design [124.54166764570972]
組合せ最適化問題は伝統的に手作りのアルゴリズムで取り組まれている。
最近の進歩は、大規模言語モデルによる自動設計の可能性を強調している。
本稿では,自動アルゴリズム設計のためのPmpt and Heuristics (EvoPH) を用いた経験進化的リフレクティブ・ガイドを提案する。
論文 参考訳(メタデータ) (2025-09-29T09:24:09Z) - ShinkaEvolve: Towards Open-Ended And Sample-Efficient Program Evolution [21.572727335985885]
ShinkaEvolveは、大規模言語モデル(LLM)を活用して、最先端のパフォーマンスと前例のない効率で科学的発見を促進するオープンソースフレームワークである。
本稿では,探索と利用のバランスをとる親サンプリング技術,効率的な探索空間探索のためのコードノベルティ・リジェクション・サンプリング,および包括的アンサンブル選択戦略を紹介する。
論文 参考訳(メタデータ) (2025-09-17T17:49:02Z) - Agentic Reinforced Policy Optimization [66.96989268893932]
検証可能な報酬付き大規模強化学習(RLVR)は,大規模言語モデル(LLM)を単一ターン推論タスクに活用する効果を実証している。
現在のRLアルゴリズムは、モデル固有のロングホライゾン推論能力と、マルチターンツールインタラクションにおけるその習熟性のバランスが不十分である。
エージェント強化ポリシー最適化(ARPO: Agentic Reinforced Policy Optimization)は,マルチターンLDMエージェントを学習するためのエージェントRLアルゴリズムである。
論文 参考訳(メタデータ) (2025-07-26T07:53:11Z) - Improving Retrospective Language Agents via Joint Policy Gradient Optimization [57.35348425288859]
RetroActは、言語エージェントのタスク計画と自己反射進化機能を共同で最適化するフレームワークである。
模倣学習と強化学習を統合した2段階共同最適化プロセスを開発した。
RetroActはタスクのパフォーマンスと意思決定プロセスを大幅に改善しています。
論文 参考訳(メタデータ) (2025-03-03T12:54:54Z) - Large Language Model-Aided Evolutionary Search for Constrained Multiobjective Optimization [15.476478159958416]
我々は,制約付き多目的最適化問題に対する進化探索を強化するために,大規模言語モデル(LLM)を用いる。
私たちの目標は、進化の集団の収束を早めることです。
論文 参考訳(メタデータ) (2024-05-09T13:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。