Fugu-MT 論文翻訳(概要): Reinforced In-Context Black-Box Optimization

論文の概要: Reinforced In-Context Black-Box Optimization

arxiv url: http://arxiv.org/abs/2402.17423v2
Date: Thu, 4 Jul 2024 05:41:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-08 23:43:31.008900
Title: Reinforced In-Context Black-Box Optimization
Title（参考訳）: 強化インコンテキストブラックボックス最適化
Authors: Lei Song, Chenxiao Gao, Ke Xue, Chenyang Wu, Dong Li, Jianye Hao, Zongzhang Zhang, Chao Qian,
Abstract要約: RIBBOは、オフラインデータからエンドツーエンドでBBOアルゴリズムを強化学習する手法である。 RIBBOは、複数の動作アルゴリズムとタスクによって生成される最適化履歴を学習するために、表現的なシーケンスモデルを使用している。提案手法の中心となるのは,テキストレグレット・ツー・ゴートークンによる最適化履歴の増大である。
参考スコア（独自算出の注目度）: 64.25546325063272
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Black-Box Optimization (BBO) has found successful applications in many fields of science and engineering. Recently, there has been a growing interest in meta-learning particular components of BBO algorithms to speed up optimization and get rid of tedious hand-crafted heuristics. As an extension, learning the entire algorithm from data requires the least labor from experts and can provide the most flexibility. In this paper, we propose RIBBO, a method to reinforce-learn a BBO algorithm from offline data in an end-to-end fashion. RIBBO employs expressive sequence models to learn the optimization histories produced by multiple behavior algorithms and tasks, leveraging the in-context learning ability of large models to extract task information and make decisions accordingly. Central to our method is to augment the optimization histories with \textit{regret-to-go} tokens, which are designed to represent the performance of an algorithm based on cumulative regret over the future part of the histories. The integration of regret-to-go tokens enables RIBBO to automatically generate sequences of query points that satisfy the user-desired regret, which is verified by its universally good empirical performance on diverse problems, including BBO benchmark functions, hyper-parameter optimization and robot control problems.
Abstract（参考訳）: Black-Box Optimization (BBO) は、科学と工学の分野で成功している。近年、BBOアルゴリズムの特定のコンポーネントをメタ学習することで、最適化を高速化し、手作りの面倒なヒューリスティックをなくすことへの関心が高まっている。拡張として、データからアルゴリズム全体を学習するには、専門家による最小限の労力が必要であり、最も柔軟性を提供することができる。本稿では,BBOアルゴリズムをオフラインデータからエンドツーエンドに強化する手法であるRIBBOを提案する。 RIBBOは、複数の行動アルゴリズムとタスクによって生成された最適化履歴を学習するために表現的シーケンスモデルを使用し、大規模モデルのコンテキスト内学習能力を活用してタスク情報を抽出し、それに応じて決定を行う。提案手法の中心となるのは,将来的な履歴に対する累積的後悔に基づくアルゴリズムの性能を表現するために設計された,‘textit{regret-to-go}トークン’による最適化履歴の増大である。 RIBBOは,BBOベンチマーク関数やハイパーパラメータ最適化,ロボット制御問題など,さまざまな問題に対して,ユーザ希望の後悔を満足するクエリポイントのシーケンスを自動的に生成する。

関連論文リスト

Task-free Adaptive Meta Black-box Optimization [55.461814601130044]
対象タスクからのみ最適化データを用いてオンラインパラメータ適応を行うアダプティブメタブラックボックス最適化モデル(ABOM)を提案する。メタトレーニングと最適化フェーズを分離する従来のメタBBOフレームワークとは異なり、ABOMはクローズドループパラメータ学習機構を導入し、パラメータ化された進化演算子を継続的に自己更新する。このパラダイムシフトはゼロショット最適化を可能にする: 合成BBOベンチマークにおけるABOMの競合性能と、手作りのトレーニングタスクを伴わない現実的な無人飛行路計画問題。
論文参考訳（メタデータ） (2026-01-29T09:54:10Z)
BLUR: A Bi-Level Optimization Approach for LLM Unlearning [105.98410883830596]
未学習問題の階層構造をモデル化することが重要であると論じる。本稿では,より優れた性能を実現する新しいアルゴリズムであるBi-Level UnleaRning(textttBLUR)を提案する。
論文参考訳（メタデータ） (2025-06-09T19:23:05Z)
LLaMEA-BO: A Large Language Model Evolutionary Algorithm for Automatically Generating Bayesian Optimization Algorithms [0.01874930567916036]
LLM(Large Language Models)は、科学的な発見を自動化するための新たな道を開いた。我々のフレームワークは進化戦略を使って、BOアルゴリズムの重要なコンポーネントを保存するPythonコードを生成するのにLLMを導く。さらなる微調整は行わなかったが、LLM生成アルゴリズムは5次元のBBOB関数を19(24の内)で上回り、より高次元に一般化し、異なるタスクをこなす。
論文参考訳（メタデータ） (2025-05-27T11:13:14Z)
PABBO: Preferential Amortized Black-Box Optimization [24.019185659134294]
優先ベイズ最適化(英: Preferential Bayesian Optimization, PBO)は、一対の設計に対する優先的なフィードバックから潜在ユーザユーティリティを学習するためのサンプリング効率のよい手法である。そこで本研究では,PBOを完全修復し,サロゲートと取得機能の両方をメタラーニングすることで,この問題を回避することを提案する。提案手法はガウスのプロセスベース戦略よりも数桁高速であり,精度で優れていることが多い。
論文参考訳（メタデータ） (2025-03-02T14:57:24Z)
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control [1.1404490220482764]
BROは、犬とヒューマノイドのタスクにおいて、ほぼ最適ポリシーを達成するためのモデルフリーのアルゴリズムである。 BROは最先端の結果を達成し、主要なモデルベースおよびモデルフリーアルゴリズムを著しく上回っている。 BROは、非常に難しい犬とヒューマノイドのタスクにおいて、ほぼ最適なポリシーを達成した最初のモデルなしアルゴリズムである。
論文参考訳（メタデータ） (2024-05-25T09:53:25Z)
Large Language Models to Enhance Bayesian Optimization [57.474613739645605]
本稿では,大規模言語モデル(LLM)の能力をベイズ最適化に組み込む新しいアプローチであるLLAMBOを提案する。高いレベルでは、自然言語のBO問題を枠組み化し、LLMが歴史的評価に照らした有望な解を反復的に提案し、評価することを可能にする。以上の結果から,LLAMBOはゼロショットウォームスタートに有効であり,サロゲートモデリングや候補サンプリングの促進,特に観察が不十分な場合の探索の初期段階において有効であることが示唆された。
論文参考訳（メタデータ） (2024-02-06T11:44:06Z)
Non-Convex Bilevel Optimization with Time-Varying Objective Functions [57.299128109226025]
本稿では,時間変化の可能なオンライン二段階最適化を提案し,エージェントがオンラインデータを用いて決定を継続的に更新する。既存のアルゴリズムと比較して、SOBOWは計算効率が良く、以前の関数を知る必要がない。軽度条件下では,SOBOWはサブリニアな局所的後悔を達成できることを示す。
論文参考訳（メタデータ） (2023-08-07T06:27:57Z)
Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文参考訳（メタデータ） (2022-10-02T05:03:38Z)
Pre-training helps Bayesian optimization too [49.28382118032923]
機能的事前設定のための代替的なプラクティスを模索する。特に、より厳密な分布を事前訓練できるような、類似した関数のデータを持つシナリオを考察する。提案手法は, 競合する手法の少なくとも3倍の効率で, 優れたハイパーパラメータを見つけることができることを示す。
論文参考訳（メタデータ） (2022-07-07T04:42:54Z)
Automatic tuning of hyper-parameters of reinforcement learning algorithms using Bayesian optimization with behavioral cloning [0.0]
強化学習(RL)では、学習エージェントが収集したデータの情報内容は多くのハイパーパラメータの設定に依存する。本研究では,ベイズ最適化を用いた自律的ハイパーパラメータ設定手法を提案する。実験は、他の手作業による調整や最適化ベースのアプローチと比較して、有望な結果を示している。
論文参考訳（メタデータ） (2021-12-15T13:10:44Z)
Meta Learning Black-Box Population-Based Optimizers [0.0]
人口ベースのブラックボックス一般化を推論するメタラーニングの利用を提案する。メタロス関数は,学習アルゴリズムが検索動作を変更することを促進し,新たなコンテキストに容易に適合できることを示す。
論文参考訳（メタデータ） (2021-03-05T08:13:25Z)
High-Dimensional Bayesian Optimization via Tree-Structured Additive Models [40.497123136157946]
変数の重複部分集合を持つ低次元関数を合成して高次元目標関数をモデル化する一般化加法モデルを検討する。私たちの目標は、必要な計算リソースを減らし、より高速なモデル学習を促進することです。我々は,合成関数と実世界のデータセットに関する様々な実験を通して,本手法の有効性を実証し,議論する。
論文参考訳（メタデータ） (2020-12-24T03:56:44Z)
Stepwise Model Selection for Sequence Prediction via Deep Kernel Learning [100.83444258562263]
本稿では,モデル選択の課題を解決するために,新しいベイズ最適化(BO)アルゴリズムを提案する。結果として得られる複数のブラックボックス関数の最適化問題を協調的かつ効率的に解くために,ブラックボックス関数間の潜在的な相関を利用する。我々は、シーケンス予測のための段階的モデル選択(SMS)の問題を初めて定式化し、この目的のために効率的な共同学習アルゴリズムを設計し、実証する。
論文参考訳（メタデータ） (2020-01-12T09:42:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。