論文の概要: CosmoCore-Evo: Evolutionary Dream-Replay Reinforcement Learning for Adaptive Code Generation
- arxiv url: http://arxiv.org/abs/2512.21351v1
- Date: Sat, 20 Dec 2025 22:12:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-29 20:48:41.750885
- Title: CosmoCore-Evo: Evolutionary Dream-Replay Reinforcement Learning for Adaptive Code Generation
- Title(参考訳): CosmoCore-Evo: 適応コード生成のための進化的ドリーム-リプレイ強化学習
- Authors: Santhosh Kumar Ravindran,
- Abstract要約: コード生成タスクの適応性と新規性を高めるために,進化的アルゴリズムを組み込んだ拡張であるCosmoCore-Evoを紹介する。
人類進化の人類学的側面にインスパイアされたコスモスコアエボは、RL軌道を夜間のリプレイ段階で突然変異と選択を行うゲノム'として扱う。
玩具シミュレーションを含む複製用コードを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building on the affective dream-replay reinforcement learning framework of CosmoCore, we introduce CosmoCore-Evo, an extension that incorporates evolutionary algorithms to enhance adaptability and novelty in code generation tasks. Inspired by anthropological aspects of human evolution, such as natural selection and adaptation in early hominids, CosmoCore-Evo treats RL trajectories as ``genomes'' that undergo mutation and selection during the nocturnal replay phase. This mechanism allows agents to break free from trained patterns, fostering emergent behaviors and improved performance in distribution-shifted environments, such as changing APIs or novel libraries. We augment the Dream Queue with evolutionary operations, including mutation of high-fitness trajectories and enterprise-tuned fitness functions that incorporate efficiency, compliance, and scalability metrics. Evaluated on extended benchmarks including HumanEval variants with shifts, BigCodeBench, and a custom PySpark pipeline simulation, CosmoCore-Evo achieves up to 35% higher novelty in solutions and 25% faster adaptation compared to the original CosmoCore and baselines like PPO and REAMER. Ablations confirm the role of evolutionary components in bridging the sentient gap for LLM agents. Code for replication, including a toy simulation, is provided.
- Abstract(参考訳): コード生成タスクの適応性と新規性を高めるために進化的アルゴリズムを組み込んだ拡張であるCosmoCore-Evoを導入する。
初期のヒト科における自然選択や適応のような人類進化の人類学的側面に触発されて、コスモスコアエボはRL軌道を「ジェノメ」として扱い、夜間のリプレイ段階で突然変異と選択を行う。
このメカニズムにより、エージェントはトレーニング済みのパターンから解放され、創発的な振る舞いが育まれ、APIや新しいライブラリの変更など、分散シフトした環境のパフォーマンスが向上する。
高適合性トラジェクトリの突然変異や、効率性、コンプライアンス、スケーラビリティのメトリクスを組み込んだ企業用に調整されたフィットネス機能を含む、進化的な操作でドリームキューを強化します。
シフトを伴うHumanEval変種、BigCodeBench、カスタムのPySparkパイプラインシミュレーションなどを含む拡張ベンチマークで評価され、CosmoCore-Evoはソリューションにおける35%の新規性と、オリジナルのCosmoCoreやPPOやREAMERのようなベースラインよりも25%高速な適応を実現している。
アブレーションは、LSM剤の知覚的ギャップを埋めることにおける進化的成分の役割を裏付ける。
玩具シミュレーションを含む複製用コードを提供する。
関連論文リスト
- Learning to Evolve with Convergence Guarantee via Neural Unrolling [37.99564850768798]
両レベルのメタ最適化フレームワークであるL2E(Learning to Evolve)を導入する。
L2Eは、KM(Krasnosel'skii-Mann)固定点理論に基づくニューラルアンローリング過程として進化探索を再構成する。
実験では、高次元空間におけるL2Eのスケーラビリティと、合成および実世界の制御タスクにまたがる堅牢なゼロショット一般化が示される。
論文 参考訳(メタデータ) (2025-12-12T10:46:25Z) - EvoIR: Towards All-in-One Image Restoration via Evolutionary Frequency Modulation [54.37259500020744]
EvoIRは、動的および適応的な画像復元のための進化周波数変調を導入する、AiOIR固有のフレームワークである。
具体的には、EvoIRは周波数変調モジュール(FMM)を採用し、特徴を高周波数分岐と低周波数分岐に明示的に分解する。
進化最適化戦略(EOS: Evolutionary Optimization Strategy)は、人口ベースの進化過程を通じて、周波数認識の目的を反復的に調整する。
論文 参考訳(メタデータ) (2025-12-04T18:59:10Z) - Evolutionary Optimization Trumps Adam Optimization on Embedding Space Exploration [1.529342790344802]
我々は,広く採用されている適応モーメント推定(Adam)に対する分離共分散行列適応進化戦略(sep-CMA-ES)の進化的最適化手法の性能について検討した。
提案手法は, 拡散モデルに対して効率よく勾配のない最適化を行い, 微調整を必要とせずに制御性を向上させることを示唆する。
論文 参考訳(メタデータ) (2025-11-05T23:31:54Z) - Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design [87.58981407469977]
進化的アルゴリズムにインスパイアされた拡散モデルを用いた推論時間報酬最適化のための新しいフレームワークを提案する。
当社のアプローチでは,各イテレーションにおける2つのステップ – ノイズ発生と報酬誘導という,反復的な改善プロセスを採用しています。
論文 参考訳(メタデータ) (2025-02-20T17:48:45Z) - Trackable Agent-based Evolution Models at Wafer Scale [0.0]
我々は,85万プロセッサCerebras Wafer Scale Engine(WSE)のエージェントベース進化から系統情報を抽出する問題に焦点をあてる。
We present a asynchronous island-based genetic algorithm (GA) framework for WSE hardware。
本研究は,これらの治験の系統的再構成を検証し,根底にある進化状態の推測に適合することを示す。
論文 参考訳(メタデータ) (2024-04-16T19:24:14Z) - When Large Language Models Meet Evolutionary Algorithms: Potential Enhancements and Challenges [50.280704114978384]
事前訓練された大規模言語モデル(LLM)は、自然なテキストを生成する強力な能力を示す。
進化的アルゴリズム(EA)は、複雑な現実世界の問題に対する多様な解決策を発見できる。
論文 参考訳(メタデータ) (2024-01-19T05:58:30Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。