論文の概要: SMCEvolve: Principled Scientific Discovery via Sequential Monte Carlo Evolution
- arxiv url: http://arxiv.org/abs/2605.15308v1
- Date: Thu, 14 May 2026 18:21:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.056107
- Title: SMCEvolve: Principled Scientific Discovery via Sequential Monte Carlo Evolution
- Title(参考訳): SMCEvolve: シークエンシャルなモンテカルロ進化による科学的発見
- Authors: Jiachen Jiang, Huminhao Zhu, Zhihui Zhu,
- Abstract要約: SMCEvolveを導入し,プログラム探索を報奨型ターゲット分布からのサンプリングとして再放送する。
我々は、目標近似誤差に到達するのに必要なLCMコール予算を制限した有限サンプル複雑性解析を提供する。
- 参考スコア(独自算出の注目度): 17.90575172925723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-driven program evolution has emerged as a powerful tool for automated scientific discovery, yet existing frameworks offer no principled guide for designing their individual components and provide no guarantee that the search converges. We introduce SMCEvolve, which recasts program search as sampling from a reward-tilted target distribution and approximates it with a Sequential Monte Carlo (SMC) sampler. From this view, three core mechanisms emerge as principled components: adaptive parent resampling, mixture of mutation with acceptance, and automatic convergence control. We further provide a finite-sample complexity analysis that bounds the LLM-call budget required to reach a target approximation error. Across math, algorithm efficiency, symbolic regression, and end-to-end ML research benchmarks, SMCEvolve surpasses state-of-the-art evolving systems while using fewer LLM calls under self-determined termination. The code is available at https://github.com/kongwanbianjinyu/SMCEvolve.
- Abstract(参考訳): LLMによるプログラム進化は、自動科学的発見のための強力なツールとして登場したが、既存のフレームワークは、個々のコンポーネントを設計するための原則的なガイドを提供しておらず、検索が収束することを保証していない。
SMCEvolveは,プログラム探索を報奨型ターゲット分布からのサンプリングとして再キャストし,それをSMCサンプリング器で近似する。
この観点から、適応的親再サンプリング、突然変異と受容の混合、自動収束制御の3つの基本メカニズムが原則として現れる。
さらに、目標近似誤差に到達するのに必要なLCMコール予算を制限した有限サンプル複雑性解析を提供する。
数学、アルゴリズム効率、シンボリックレグレッション、エンド・ツー・エンドのML研究ベンチマークを通じて、SMCEvolveは最先端の進化するシステムを超越し、自己決定的な終了条件下でのLLM呼び出しを少なくする。
コードはhttps://github.com/Kongwanbianjinyu/SMCEvolve.comで公開されている。
関連論文リスト
- From I/O to Code with Discovery Agent [103.88427301265669]
IO2Codeの発見エージェントであるDIO-Agentを提案する。
本手法は,プログラム空間上の進化的探索としてIO2Codeをフレーム化する。
大規模な実験により、DIO-Agentは従来のプログラムバイサンプル法とSOTA進化エージェントベースラインの両方を一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2026-05-14T18:57:32Z) - Execution-Verified Reinforcement Learning for Optimization Modeling [49.171122807323634]
実行検証学習フレームワークは、数学的プログラミング解法を決定論的で対話的な検証器として扱う。
NL4OPT, MAMO, IndustryOR, OptiBenchをグロビ, OR-Tools, COPTで行った実験では, EVOMがプロセス管理SFTに適合または優れていた。
論文 参考訳(メタデータ) (2026-04-01T03:39:11Z) - Autonomous Control Leveraging LLMs: An Agentic Framework for Next-Generation Industrial Automation [0.0]
本稿では,大規模言語モデル(LLM)を個別のフォールトリカバリ計画と継続的プロセス制御の両方に活用する統合エージェントフレームワークを提案する。
その結果、構造化されたフィードバックとモジュラーエージェントにより、LLMは高レベルな記号計画と低レベルな連続制御を統一できることを示した。
論文 参考訳(メタデータ) (2025-07-03T11:20:22Z) - I-MCTS: Enhancing Agentic AutoML via Introspective Monte Carlo Tree Search [10.718560472954644]
イントロスペクティブモンテカルロ木探索(Introspective Monte Carlo Tree Search, I-MCTS)は、イントロスペクティブプロセスを通じてツリーノードを反復的に拡張する新しいアプローチである。
我々は,各ノードの解の直接評価を容易にするために,LLM(Large Language Model)ベースの値モデルを統合する。
当社のアプローチでは,強力なオープンソースAutoMLエージェントと比較して,パフォーマンスが6%向上している。
論文 参考訳(メタデータ) (2025-02-20T16:19:09Z) - Sequential Monte Carlo Steering of Large Language Models using
Probabilistic Programs [46.721838623748816]
本研究では,大規模言語モデルの出力に対する構文的制約と意味的制約を強制する新しい推論時手法を提案する。
主要なアイデアは、言語生成タスクを離散確率列モデルのクラスにおける後部推論問題として指定することである。
ビームサーチと同様の計算コストのために、SMCは多様なタスクを解決するためにLSMを操ることができる。
論文 参考訳(メタデータ) (2023-06-05T17:55:05Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - mlOSP: Towards a Unified Implementation of Regression Monte Carlo
Algorithms [0.0]
最適停止問題に対する機械学習のための計算テンプレートであるmlOSPを紹介する。
テンプレートはR統計環境で実装され、GitHubリポジトリ経由で公開されている。
論文 参考訳(メタデータ) (2020-12-01T18:41:02Z) - Theoretical Convergence of Multi-Step Model-Agnostic Meta-Learning [63.64636047748605]
一般的なマルチステップMAMLアルゴリズムに対して収束保証を提供するための新しい理論フレームワークを開発する。
特に,本研究の結果は,収束を保証するためには,内部段階のステップを逆比例して$N$の内段ステップを選択する必要があることを示唆している。
論文 参考訳(メタデータ) (2020-02-18T19:17:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。