Fugu-MT 論文翻訳(概要): Rollout Algorithms and Approximate Dynamic Programming for Bayesian Optimization and Sequential Estimation

論文の概要: Rollout Algorithms and Approximate Dynamic Programming for Bayesian Optimization and Sequential Estimation

arxiv url: http://arxiv.org/abs/2212.07998v1
Date: Thu, 15 Dec 2022 17:50:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-16 17:43:51.696648
Title: Rollout Algorithms and Approximate Dynamic Programming for Bayesian Optimization and Sequential Estimation
Title（参考訳）: ベイズ最適化と逐次推定のためのロールアウトアルゴリズムと近似動的計画法
Authors: Dimitri Bertsekas
Abstract要約: 逐次推定を含む様々な問題に適用可能な、統一された近似的動的プログラミングフレームワークを提供する。まず,最適化を目的とした代理コスト関数の構築を検討し,ベイズ最適化の特別な場合に着目した。次に、最適測定選択を用いた確率ベクトルの逐次推定のより一般的な場合とその適応制御問題への応用について述べる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We provide a unifying approximate dynamic programming framework that applies to a broad variety of problems involving sequential estimation. We consider first the construction of surrogate cost functions for the purposes of optimization, and we focus on the special case of Bayesian optimization, using the rollout algorithm and some of its variations. We then discuss the more general case of sequential estimation of a random vector using optimal measurement selection, and its application to problems of stochastic and adaptive control. We finally consider related search and sequential decoding problems, and a rollout algorithm for the approximate solution of the Wordle and Mastermind puzzles, recently developed in the paper [BBB22].
Abstract（参考訳）: 逐次推定を含む様々な問題に適用可能な、統一された近似動的プログラミングフレームワークを提供する。まず,最適化を目的とした代理コスト関数の構築について考察し,ロールアウトアルゴリズムとそのバリエーションを用いてベイズ最適化の特別な事例に焦点を当てる。次に、最適計測選択を用いたランダムベクトルの逐次推定のより一般的な場合と、確率的・適応的制御の問題への応用について論じる。我々はついに関連する探索問題と逐次復号問題、そして最近論文[BBB22]で開発されたWordleとMastermindの近似解のロールアウトアルゴリズムについて考察した。

関連論文リスト

On Constructing Algorithm Portfolios in Algorithm Selection for Computationally Expensive Black-box Optimization in the Fixed-budget Setting [0.0]
本稿では,アルゴリズムポートフォリオ構築におけるサンプリングフェーズにおける関数評価の回数を考慮することの重要性を論じる。その結果,提案手法により構築されたアルゴリズムのポートフォリオは,従来の手法よりも大幅に向上していることがわかった。
論文参考訳（メタデータ） (2024-05-13T03:31:13Z)
Enhancing Gaussian Process Surrogates for Optimization and Posterior Approximation via Random Exploration [2.984929040246293]
ガウス過程シュロゲートモデルの精度を高めるために、ランダムな探索ステップに依存する新しいノイズフリーベイズ最適化戦略。新しいアルゴリズムは、古典的なGP-UCBの実装の容易さを維持しているが、さらなる探索がそれらの収束を促進する。
論文参考訳（メタデータ） (2024-01-30T14:16:06Z)
Accelerating Cutting-Plane Algorithms via Reinforcement Learning Surrogates [49.84541884653309]
凸離散最適化問題に対する現在の標準的なアプローチは、カットプレーンアルゴリズムを使うことである。多くの汎用カット生成アルゴリズムが存在するにもかかわらず、大規模な離散最適化問題は、難易度に悩まされ続けている。そこで本研究では,強化学習による切削平面アルゴリズムの高速化手法を提案する。
論文参考訳（メタデータ） (2023-07-17T20:11:56Z)
Socio-cognitive Optimization of Time-delay Control Problems using Evolutionary Metaheuristics [89.24951036534168]
メタヒューリスティックス(Metaheuristics)は、古典的なアプローチでは解決できない難解な問題を解くために使用される普遍的な最適化アルゴリズムである。本稿では,キャストに基づく新しい社会認知メタヒューリスティックの構築を目標とし,このアルゴリズムのいくつかのバージョンを時間遅延システムモデルの最適化に適用する。
論文参考訳（メタデータ） (2022-10-23T22:21:10Z)
On Adaptivity in Non-stationary Stochastic Optimization With Bandit Feedback [11.208914594208654]
集約された関数の変化が事前認識されている場合、単純な再起動アルゴリズムが最適の動的後悔を達成できることが示される。また,静止ベンチマークに対して良好な後悔を達成するアルゴリズムを,動的ベンチマークに対して良い後悔を与えるアルゴリズムに自動的に変換できることを示す。
論文参考訳（メタデータ） (2022-10-11T16:16:34Z)
Adaptive First- and Second-Order Algorithms for Large-Scale Machine Learning [3.0204520109309843]
機械学習における連続最適化問題に対処する一階法と二階法を考察する。一階述語の場合、半決定論的から二次正規化への遷移の枠組みを提案する。本稿では,適応的なサンプリングと適応的なステップサイズを持つ新しい1次アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-11-29T18:10:00Z)
Outlier-Robust Sparse Estimation via Non-Convex Optimization [73.18654719887205]
空間的制約が存在する場合の高次元統計量と非破壊的最適化の関連について検討する。これらの問題に対する新規で簡単な最適化法を開発した。結論として、効率よくステーションに収束する一階法は、これらのタスクに対して効率的なアルゴリズムを導出する。
論文参考訳（メタデータ） (2021-09-23T17:38:24Z)
Adaptive Sampling of Pareto Frontiers with Binary Constraints Using Regression and Classification [0.0]
本稿では,二項制約を持つブラックボックス多目的最適化問題に対する適応最適化アルゴリズムを提案する。本手法は確率的回帰モデルと分類モデルに基づいており,最適化目標のサロゲートとして機能する。また,予想される超体積計算を高速化するために,新しい楕円形トランケーション法を提案する。
論文参考訳（メタデータ） (2020-08-27T09:15:02Z)
Convergence of adaptive algorithms for weakly convex constrained optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文参考訳（メタデータ） (2020-06-11T17:43:19Z)
Stochastic batch size for adaptive regularization in deep network optimization [63.68104397173262]
ディープラーニングフレームワークにおける機械学習問題に適用可能な適応正規化を取り入れた一階最適化アルゴリズムを提案する。一般的なベンチマークデータセットに適用した従来のネットワークモデルに基づく画像分類タスクを用いて,提案アルゴリズムの有効性を実証的に実証した。
論文参考訳（メタデータ） (2020-04-14T07:54:53Z)
Extreme Algorithm Selection With Dyadic Feature Representation [78.13985819417974]
我々は,数千の候補アルゴリズムの固定セットを考慮に入れた,極端なアルゴリズム選択(XAS)の設定を提案する。我々は、XAS設定に対する最先端のAS技術の適用性を評価し、Dyadic特徴表現を利用したアプローチを提案する。
論文参考訳（メタデータ） (2020-01-29T09:40:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。