論文の概要: Open-Ended Task Discovery via Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2605.07572v1
- Date: Fri, 08 May 2026 10:43:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.00347
- Title: Open-Ended Task Discovery via Bayesian Optimization
- Title(参考訳): ベイジアン最適化によるオープンエンディングタスク発見
- Authors: Masaki Adachi, Yuta Suzuki, Juliusz Ziomek,
- Abstract要約: 本稿では,タスク生成とタスク最適化を交互に行うフレームワークであるGenerate-Select-Refine(GSR)を紹介する。
GSRは最高のタスクの評価に集中し、対数的後悔のオーバーヘッドのみを発生させる。
GSRを新たな製品開発、化学スケーリング分析、特許再取得に適用する。
- 参考スコア(独自算出の注目度): 5.225254533678074
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: When applying Bayesian optimization (BO) to scientific workflow, a major yet often overlooked source of uncertainty is the task itself -- namely, what to optimize and how to evaluate it -- which can evolve as evidence accumulates. We introduce Generate-Select-Refine (GSR), a open-ended BO framework that alternates between task generation and task optimization. Starting from a user-provided seed task, GSR generates new tasks in a coarse-to-fine manner while a task-acquisition function schedules optimization. Asymptotically, it concentrates evaluations on the best task, incurring only logarithmic regret overhead relative to single-task BO. We apply GSR to new product development, chemical synthesis scaling, algorithm analysis, and patent repurposing, where it outperforms existing LLM-based optimizers.
- Abstract(参考訳): 科学ワークフローにベイズ最適化(BO)を適用するとき、しばしば見落とされがちな不確実性の原因はタスクそのもの、すなわち、何を最適化し、どのように評価するかである。
本稿では,タスク生成とタスク最適化を交互に行う,オープンなBOフレームワークであるGenerate-Select-Refine(GSR)を紹介する。
ユーザが提供するシードタスクから始まり、タスク獲得関数が最適化をスケジュールしている間、GSRは粗大な方法で新しいタスクを生成する。
漸近的に、最高のタスクに対する評価に集中し、シングルタスクBOに対する対数的後悔のオーバーヘッドのみを発生させる。
我々はGSRを新しい製品開発、化学合成スケーリング、アルゴリズム分析、特許再取得に適用し、既存のLLMオプティマイザよりも優れている。
関連論文リスト
- BayMOTH: Bayesian optiMizatiOn with meTa-lookahead -- a simple approacH [13.980560488480435]
本稿では,関連タスク情報を利用したメタBOアルゴリズムを提案する。
本稿では,関数最適化タスクにおける既存手法との競合性を実証する。
論文 参考訳(メタデータ) (2026-04-13T19:52:08Z) - Task-free Adaptive Meta Black-box Optimization [55.461814601130044]
対象タスクからのみ最適化データを用いてオンラインパラメータ適応を行うアダプティブメタブラックボックス最適化モデル(ABOM)を提案する。
メタトレーニングと最適化フェーズを分離する従来のメタBBOフレームワークとは異なり、ABOMはクローズドループパラメータ学習機構を導入し、パラメータ化された進化演算子を継続的に自己更新する。
このパラダイムシフトはゼロショット最適化を可能にする: 合成BBOベンチマークにおけるABOMの競合性能と、手作りのトレーニングタスクを伴わない現実的な無人飛行路計画問題。
論文 参考訳(メタデータ) (2026-01-29T09:54:10Z) - TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization [97.18886232580131]
大規模言語モデルは、ツール統合による複雑なタスクにおいて強力な推論能力を示している。
そこで我々はターンレベルグループサンプリングを行う軽量RLアルゴリズムであるTurn-Level GRPOを提案する。
論文 参考訳(メタデータ) (2026-01-23T06:21:33Z) - None To Optima in Few Shots: Bayesian Optimization with MDP Priors [40.4319486959011]
本稿では,機能評価が極めて少ないブラックボックス最適化法であるProfBOアルゴリズムを提案する。
ProfBOは、高い品質のチューニングソリューションを極めて少ない評価で達成することで、最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-02T16:53:17Z) - Large Scale Multi-Task Bayesian Optimization with Large Language Models [29.12351845364205]
本稿では,大規模言語モデル(LLM)を活用して,従来の最適化軌道から学習し,改良する手法を提案する。
本手法は,データベースクエリ最適化と抗菌ペプチドの設計の2つの異なる領域で評価する。
論文 参考訳(メタデータ) (2025-03-11T07:46:19Z) - Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文 参考訳(メタデータ) (2024-06-12T16:58:41Z) - Accelerating Bayesian Optimization for Biological Sequence Design with
Denoising Autoencoders [28.550684606186884]
我々は,識別可能なマルチタスクガウスプロセスヘッドを用いて,デノナイズドオートエンコーダを共同で訓練する手法を開発した。
我々はZINCデータセットに基づく小分子上でLaMBOを評価し,蛍光タンパク質をターゲットとした新しい大規模分子タスクを導入する。
論文 参考訳(メタデータ) (2022-03-23T21:58:45Z) - Real-Time Optimization Meets Bayesian Optimization and Derivative-Free
Optimization: A Tale of Modifier Adaptation [0.0]
本稿では,不確実なプロセスのリアルタイム最適化において,プラントモデルミスマッチを克服するための修飾子適応方式について検討する。
提案したスキームは物理モデルを組み込んでおり、探査中のリスクを最小限に抑えるために信頼領域のアイデアに依存している。
取得関数の使用、プロセスノイズレベルを知る、または名目上のプロセスモデルを指定する利点を図示する。
論文 参考訳(メタデータ) (2020-09-18T12:57:17Z) - Global Optimization of Gaussian processes [52.77024349608834]
少数のデータポイントで学習したガウス過程を訓練した空間定式化を提案する。
このアプローチはまた、より小さく、計算的にもより安価なサブソルバを低いバウンディングに導く。
提案手法の順序の順序による時間収束を,総じて低減する。
論文 参考訳(メタデータ) (2020-05-21T20:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。