論文の概要: SeaEvo: Advancing Algorithm Discovery with Strategy Space Evolution
- arxiv url: http://arxiv.org/abs/2604.24372v1
- Date: Mon, 27 Apr 2026 12:06:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.977907
- Title: SeaEvo: Advancing Algorithm Discovery with Strategy Space Evolution
- Title(参考訳): SeaEvo: 戦略空間の進化によるアルゴリズム発見の促進
- Authors: Sichun Luo, Yi Huang, Haochen Luo, Fengyuan Liu, Guanzhi Deng, Lei Li, Qinghua Yao, Zefa Hu, Junlan Feng, Qi Liu,
- Abstract要約: LLM誘導進化探索は、自動アルゴリズム発見のための有望なパラダイムとして登場した。
モデルは、自然言語の戦略記述を第一級の集団レベルの進化状態に高めるモジュラー戦略空間層である。
モデルは、ほとんどの設定において、基盤となる進化のバックボーンを改善する。
- 参考スコア(独自算出の注目度): 31.165726518569155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-guided evolutionary search has emerged as a promising paradigm for automated algorithm discovery, yet most systems track search progress primarily through executable programs and scalar fitness. Even when natural-language reflection is used, it is often used locally in mutation prompts or stored without an explicit population-level organization of strategic directions. As a result, evolutionary search can struggle to distinguish syntactically different implementations of the same idea, preserve lower-fitness but strategically promising directions, or detect when an entire family of strategies has saturated. We introduce \model, a modular strategy-space layer that elevates natural-language strategy descriptions from transient prompt context to first-class population-level evolutionary state in LLM-driven program search. \model augments each candidate program with an explicit natural language strategy description and uses this representation in three ways: Strategy Articulation turns mutation into a diagnose-direct-implement process; Stratified Experience Retrieval organizes the archive into strategy clusters and selects inspirations by behavioral complementarity; and Strategic Landscape Navigation periodically summarizes effective, saturated, and underexplored strategy families to guide future mutations. Across mathematical algorithm discovery, systems optimization, and agent-scaffold benchmarks, \model improves the underlying evolutionary backbones in most settings, with particularly large gains (21% relative improvement) on open-ended system optimization tasks. These results suggest that persistent strategy representations provide a practical mechanism for improving the robustness and efficiency of LLM-guided evolutionary search, suggesting a path toward compound AI systems that accumulate algorithmic knowledge over time.
- Abstract(参考訳): LLM誘導の進化的探索は、自動アルゴリズム発見のための有望なパラダイムとして登場したが、ほとんどのシステムは、主に実行可能なプログラムとスカラー適合性によって、探索の進捗を追跡する。
自然言語の反射を用いたとしても、しばしば局所的に突然変異のプロンプトや、明確な集団レベルの戦略方向の組織を持たない保存に用いられる。
その結果、進化的探索は、同じアイデアの構文的に異なる実装を区別したり、低い適合性を維持しながら戦略的に有望な方向を維持したり、戦略のファミリー全体が飽和したことを検知するのに苦労する可能性がある。
LLMによるプログラム探索において、過渡的急進的文脈から一級集団レベルの進化状態への自然言語戦略記述を増大させるモジュール型戦略空間層である \model を導入する。
戦略アーティキュレーション(Strategy Articulation)は、突然変異を診断直接実装プロセスに変換する; 戦略経験検索(Stratetified Experience Retrieval)は、アーカイブを戦略クラスタに整理し、行動補完性によってインスピレーションを選択する; 戦略ランドスケープナビゲーション(Strategic Landscape Navigation)は、定期的に効果的で飽和し、探索されていない戦略ファミリーを要約し、将来の突然変異を導く。
数学的アルゴリズムの発見、システム最適化、エージェント・スキャフォールド・ベンチマークなど、ほとんどの設定において基礎となる進化のバックボーンは改善され、特にオープンエンドのシステム最適化タスクにおいて大きな改善(21%の相対的な改善)がなされている。
これらの結果は、永続的な戦略表現が、LLM誘導進化探索の堅牢性と効率を向上させるための実践的なメカニズムを提供することを示唆し、時間とともにアルゴリズム知識を蓄積する複合AIシステムへの道筋を示唆している。
関連論文リスト
- Expanding LLM Agent Boundaries with Strategy-Guided Exploration [51.98616048282804]
強化学習(RL)は、コンピュータ使用、ツール呼び出し、コーディングなどのタスクのエージェントとして、大規模言語モデル(LLM)の訓練後において顕著な成功を収めた。
我々は,低レベルな行動から高レベルな言語戦略に移行するための戦略ガイド探索(SGE)を提案する。
論文 参考訳(メタデータ) (2026-03-02T16:28:39Z) - EvoX: Meta-Evolution for Automated Discovery [115.89434419482797]
EvoXは、独自の進化過程を最適化する適応進化法である。
進捗に応じて、事前のソリューションが選択され、どのように変化するかを継続的に更新する。
AlphaEvolve, OpenEvolve, GEPA, ShinkaEvolveなどの既存のAI駆動の進化的手法を、タスクの大部分で上回っている。
論文 参考訳(メタデータ) (2026-02-26T18:54:41Z) - AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization [61.535567824938205]
本稿では,LLMによる進化を階層的適応最適化問題として再構成するフレームワークであるAdaEvolveを紹介する。
AdaEvolveは185の異なるオープンエンド最適化問題において、オープンエンドベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-23T18:45:31Z) - Discovering Multiagent Learning Algorithms with Large Language Models [8.649235365712004]
我々は,大規模言語モデルを用いた進化的符号化エージェントであるAlphaEvolveを用いて,新しいマルチエージェント学習アルゴリズムを自動発見する。
ゲーム理論学習の2つの異なるパラダイムのための新しい変種を進化させることにより、この枠組みの一般化を実証する。
論文 参考訳(メタデータ) (2026-02-18T22:41:00Z) - Beyond Algorithm Evolution: An LLM-Driven Framework for the Co-Evolution of Swarm Intelligence Optimization Algorithms and Prompts [2.7320188728052064]
本稿では,Swarmインテリジェンスアルゴリズムと誘導プロンプトの協調進化のための新しいフレームワークを提案する。
このフレームワークはNP問題に対して厳格に評価され、優れた性能を示した。
我々の研究は群知能最適化アルゴリズムの新しいパラダイムを確立し、即時進化の必然的な役割を浮き彫りにする。
論文 参考訳(メタデータ) (2025-12-10T00:37:16Z) - Experience-Guided Adaptation of Inference-Time Reasoning Strategies [49.954515048847874]
Experience-Guided Reasoner (EGuR) は蓄積された経験に基づいて推論時に調整された戦略を生成する。
EGuRは最強のベースラインに対して最大14%の精度向上を実現し、計算コストを最大111倍に削減する。
論文 参考訳(メタデータ) (2025-11-14T17:45:28Z) - Reinforced Strategy Optimization for Conversational Recommender Systems via Network-of-Experts [63.412646471177645]
会話レコメンダシステム(CRS)のための新しい強化戦略最適化(RSO)手法を提案する。
RSOは、戦略駆動型応答決定をマクロレベルの戦略計画とマイクロレベルの戦略適応に分解する。
実験の結果, RSOは最先端のベースラインと比較して, インタラクション性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2025-09-30T11:12:01Z) - Behaviour Space Analysis of LLM-driven Meta-heuristic Discovery [2.0958996366233094]
メタヒューリスティックな最適化アルゴリズムを大規模言語モデル駆動型アルゴリズム探索法で自動生成する。
我々は、BBOBベンチマークスイートから10個の関数に対して評価したブラックボックス最適化を反復的に進化させる。
探索,搾取,収束,停滞といった行動指標を各実行毎に記録し,これらを視覚的投影とネットワークベースの表現を通じて分析する。
論文 参考訳(メタデータ) (2025-07-04T14:19:39Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - Discovering Evolution Strategies via Meta-Black-Box Optimization [23.956974467496345]
メタラーニングによる進化戦略の効果的な更新ルールの発見を提案する。
本手法では,自己注意型アーキテクチャによってパラメータ化された探索戦略を用いる。
進化戦略をスクラッチから自己参照的に訓練することは可能であり、学習された更新ルールは外部メタラーニングループを駆動するために使用される。
論文 参考訳(メタデータ) (2022-11-21T08:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。